本帖最后由 lzqggg 于 2016-1-3 20:31 编辑
) Y1 ]6 v, f: h% }- M. O5 v: Z+ A0 q
严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);8 Q2 v; [' O- q, `( ]
以下三个定义:
# x @# k5 g/ C: w 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 $ x2 V$ A7 }) L
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
3 n6 i4 [9 p6 r: [ 所谓的双方优势策略则是指双方利益总和最大的策略。 4 d: F6 U: T; H5 m) A
[编辑本段]严格优势策略举例分析/ P! \! V% ]; J7 e4 X
一、经典的囚徒困境
' y% W! Q0 }' X. A% F1 E 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
" O& |& [- K" m/ U' W& [: q 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
6 s! i. e; I, @8 P! x4 O 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
+ `* }+ Z) u) [. b, h 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
- [/ H; n# Y: h( b 若二人都互相检举(互相“背叛”),则二人同样判监2年。' @9 e8 s/ e& L& x. V0 D1 M
# E, b9 G7 a' r; \6 p3 A- ^用表格概述如下:% W7 l) \% P3 w" P+ l0 Q
2 }' u8 V8 | D/ g 甲沉默(合作) 甲认罪(背叛)
) J4 N' j: N8 r5 S# H乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
, M. C0 l. Y8 `+ q, R4 d/ N3 v乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 $ B* w7 K/ g: |7 c1 b% L
( m( `& [, J/ M& v1 g& T 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
) g2 B: g. A% ^3 J# y 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: 8 N/ f! C9 _- H4 R$ s( X% S
若对方沉默、背叛会让我获释,所以会选择背叛。 6 j C5 Q: c0 g# n: v' ?% g- g0 b
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 , Y9 N: Z# w% M! B
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
( Q' f! K. R' M, i8 J( m 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 ) Y' A& Z% f2 L4 f. t5 g
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。1 X( v, x9 j6 W6 C, l% a
[编辑本段]二、智猪博弈理论* g, E, O2 E* U0 \' R5 Y- l' K' c
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
9 ^/ H6 S' b, F0 C" ^ 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 3 s0 X( M: g9 G) v0 W' P
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 Y4 m W H1 m5 y, s- U2 y
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 # q2 k+ U7 f* h/ J8 x
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
3 T, H1 Y0 |3 U# C4 C# ]$ Y" k 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 9 A/ C0 @9 [4 I) y/ \6 r @' g0 X$ e
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
3 k7 Z) f- Y: N* Z6 b7 ^; Q * c0 N+ N! K, E; c
三、关于企业价格策略 k; f+ e" L- s( G
% J0 T$ n, e1 p! d1 e+ K$ k0 X
6 ^! c! H/ H) s# H# D+ T 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
, z2 ^9 n4 ~& J6 \4 v6 `- S 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);* c" z' u7 T5 c" Y8 x" L
以下三个定义:2 d3 f; T; i2 p! |0 j4 Z: a
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 ' |' O& S, |# U4 T) E& [! @$ G7 Z6 l
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
( w8 V& s; F6 ? 所谓的双方优势策略则是指双方利益总和最大的策略。 # B8 Z w1 s% J% F: r! ^
[编辑本段]严格优势策略举例分析
5 h0 g; a" f/ P; I4 e) [ 一、经典的囚徒困境
3 I4 N, h- M8 k/ A3 H 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: + X7 L7 s0 q7 c$ L. g
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
9 R1 Q" n$ j# S: j! F 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 $ |2 r; J! X- m' S. @# d& z' z( [; z
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
6 ]5 O8 E" `. Y7 d 若二人都互相检举(互相“背叛”),则二人同样判监2年。1 P) J" S2 u0 M4 d
+ F& ]0 n& P ?% l. T' c
用表格概述如下:) [& T, v: ` p+ X f. M! f8 {* J# Y7 X% j
% ~( w+ V: }0 X) A
甲沉默(合作) 甲认罪(背叛)
) v$ Q& U8 E4 n/ s2 r4 G% Q3 [/ ?乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
+ \$ u3 K- ]3 u$ N4 ~* j' y6 j+ L乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 " ?$ y' }% Z( M) |" y) k
; w' ^4 T6 ]4 z. Q+ z4 V
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
; @# ~* _0 B, z9 i$ B; M$ w 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
2 @- w9 f6 |! I z 若对方沉默、背叛会让我获释,所以会选择背叛。 4 w+ [3 k8 X6 j& b' G% t$ T
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
# z* F7 P8 Z$ p3 A' U6 N' n 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
% L6 y. E/ L$ e2 Q1 ~9 ?( T1 D6 n 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 ! O' K- a& ?) S" C" l
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
. `, |5 P: a4 x$ H[编辑本段]二、智猪博弈理论
1 h) D' p- W3 }6 m* d0 p8 { 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
# Y9 u9 I0 q8 Q8 Q 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 ( j2 T7 f: B, O% `
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
* }$ F* H) C7 K, U% y4 A 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
% H) b1 j1 M/ I6 g “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 - G5 T8 j$ g, s+ N% y. c
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
! {" Q9 Y, n4 ~3 H+ a8 ? 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
3 q9 a* F3 K/ J+ H/ u$ I+ L
T! n2 }3 ?0 F7 k L) [三、关于企业价格策略1 M3 e, x. r9 N: g4 Q
5 ]+ ]" k; v- L6 K+ e+ g' M 0 i* {8 Y- a: T$ Y, @! n) D6 M
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
* m' _* n2 k9 H) N3 ` 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
+ f$ r0 f" Z2 Z' F( F 以下三个定义:
- | U1 ?, a2 U7 V5 e: K* ? 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 , Q1 J8 M4 E1 N3 f% _
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
; P. z' {2 R+ ?1 Y8 x+ s% U 所谓的双方优势策略则是指双方利益总和最大的策略。 3 z- A6 F$ W4 G! D! x
[编辑本段]严格优势策略举例分析. ^4 q j' @6 J+ f# z2 x, k
一、经典的囚徒困境 * h2 `! ?# v" f/ J2 F- d B
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
, I0 J. n$ L6 ~( ~* K: e: l) O 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: & s! g ^( p' U1 n' i% M: i
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
8 @5 \; ~ T3 q* r2 o 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 ! Z* y; l9 O7 J3 J. d$ I8 }
若二人都互相检举(互相“背叛”),则二人同样判监2年。
+ y' ^' q1 d. L% P" W
: ]3 Z" t7 s* c( l用表格概述如下:1 C. i0 H4 J: ]1 R0 g2 F7 [5 `
2 L( D- N, v8 [6 Z- y8 }8 }1 P: @ 甲沉默(合作) 甲认罪(背叛)
* `$ R1 }, F( X& @# ~乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 $ d- s/ h6 n, `7 {1 }" J' v
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 5 j0 y2 `& e! C9 B
# y* s* t5 S. R 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
9 L: d. y7 Y2 G8 V 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
6 t( ` K' q( Z1 C8 w( x 若对方沉默、背叛会让我获释,所以会选择背叛。
$ ?9 A X$ ]& O 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
1 c8 H C8 ?" ^9 _ 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
- ~3 Q: z: y9 R) B" M 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 & t# q& |- W% Z( E: u3 n4 O5 W
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。 g% \4 B9 Z( U& i2 V2 L x' p% w
[编辑本段]二、智猪博弈理论
/ h( H- H4 J" i0 Y 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
6 |! Z' m; a. x- F4 y0 p1 V 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
( z4 ~) |& {9 u9 p& ~9 s2 a 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 0 j; _: X. R) A" n2 \+ {$ l" F
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
8 C7 K$ A3 n9 n6 W9 B “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 4 y9 O8 \2 h6 J. y3 L! T
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
! h, Q0 S u- A. }* N5 h 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。$ i) p0 u$ x2 z
6 j1 |4 h" S+ M
三、关于企业价格策略5 I6 ~1 a( F$ l1 F' m1 @
2 W& E! c% o2 n: S, |
, q" V, \) x' y' x! [. O! b/ ]
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? 8 x Y9 `1 ~+ B6 a9 `$ F2 q
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);( j( D7 v4 k! t! k3 M/ A. p
以下三个定义:8 @" n4 U9 P" [* {9 a r# b
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 ; O3 k* Z; z1 M! c; m7 g* Z. l2 D/ D
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
6 _0 l1 V9 C9 _* E H) [ 所谓的双方优势策略则是指双方利益总和最大的策略。 8 ~& {( ? p% `$ T2 \2 N7 b# j$ k0 ~
[编辑本段]严格优势策略举例分析% f! u- j5 E$ Z1 d4 q. z3 y
一、经典的囚徒困境 U! O6 N6 o! f( A& J& S
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
! w, Z, k+ l b( w) ]) T1 e3 u 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
( n( J4 l( @1 h* Y- c0 d* v 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 ! ~* _- o! `, b2 R# A! W
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 ' I- g7 ?2 Z& Z% c9 ?
若二人都互相检举(互相“背叛”),则二人同样判监2年。
$ T2 ~* l! a- g ) L) P9 Y4 U- l4 U: e; z8 _( b
用表格概述如下:
* B, v. {' V5 a' y) B
. b$ X" X3 Y; M3 ]3 Y1 ~6 j% m 甲沉默(合作) 甲认罪(背叛) 2 S5 G7 I6 G' @) E
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 1 m, t6 C" d( F: l, Y
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 6 g) m4 ~& z) ]' ?1 m& ]
: A/ Z- h- X4 F4 S
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 * Q, e% x u2 g% n
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
9 O" z" C9 C0 m, X1 r 若对方沉默、背叛会让我获释,所以会选择背叛。 + d. }: p) i7 x* r5 a3 A9 V$ I7 U2 @
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 " i0 k4 s% T9 M0 R
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 1 q* V; v& ]1 Y7 h
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
* o8 m! Q7 u3 o+ E: ] 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。6 P1 M4 [& m: D6 @& F9 F
[编辑本段]二、智猪博弈理论
; |3 }5 h. O: U+ B: ` 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
7 E& d) O3 l6 u2 }3 z+ c; s 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 1 e) f7 @! |6 Z* r" W7 e
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
3 W) G. o) t& g 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
- k: q8 g7 p! i' b+ x" ~$ ]& T “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 % A$ I+ l- n: i/ D' n
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 % n3 \* y$ P- c, [7 t& N4 R5 n J
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
2 ?9 C& a$ _% x, D; o
/ Z' [' a3 ?6 J# P三、关于企业价格策略
# a% N( `: z; ~& K8 V l3 @
2 s4 B) Z/ [4 Y s- b3 _- d( r
: j+ X T1 B9 c; H w6 g 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? 6 ~0 S5 f& `) X& }
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局 |