关灯
《文稿,还能这样写》作者雄文《笔杆子碎语》作者王一端《机关文稿写作入门》作者杨新宇《机关文字工作五十讲》作者何新国
最新《公文写作培训课程》直播间《公文写作百法例讲》作者房立洲老秘网站长、《老秘笔记》作者老猫《公文高手的自我修养》作者胡森林
开启左侧

人生有许多无耐

[复制链接]
lzqggg 发表于 2015-12-31 11:31:17 | 显示全部楼层 |阅读模式 打印 上一主题 下一主题
 
公文写作培训班
本帖最后由 lzqggg 于 2016-1-3 20:31 编辑
) Y1 ]6 v, f: h% }- M. O5 v: Z+ A0 q
严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);8 Q2 v; [' O- q, `( ]
  以下三个定义:
# x  @# k5 g/ C: w  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 $ x2 V$ A7 }) L
  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
3 n6 i4 [9 p6 r: [  所谓的双方优势策略则是指双方利益总和最大的策略。  4 d: F6 U: T; H5 m) A
[编辑本段]严格优势策略举例分析/ P! \! V% ]; J7 e4 X
  一、经典的囚徒困境
' y% W! Q0 }' X. A% F1 E  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
" O& |& [- K" m/ U' W& [: q  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
6 s! i. e; I, @8 P! x4 O  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
+ `* }+ Z) u) [. b, h  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
- [/ H; n# Y: h( b  若二人都互相检举(互相“背叛”),则二人同样判监2年。' @9 e8 s/ e& L& x. V0 D1 M
  
# E, b9 G7 a' r; \6 p3 A- ^用表格概述如下:% W7 l) \% P3 w" P+ l0 Q

2 }' u8 V8 |  D/ g    甲沉默(合作)  甲认罪(背叛)  
) J4 N' j: N8 r5 S# H乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  
, M. C0 l. Y8 `+ q, R4 d/ N3 v乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  $ B* w7 K/ g: |7 c1 b% L

( m( `& [, J/ M& v1 g& T  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
) g2 B: g. A% ^3 J# y  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: 8 N/ f! C9 _- H4 R$ s( X% S
  若对方沉默、背叛会让我获释,所以会选择背叛。 6 j  C5 Q: c0 g# n: v' ?% g- g0 b
  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 , Y9 N: Z# w% M! B
  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
( Q' f! K. R' M, i8 J( m  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 ) Y' A& Z% f2 L4 f. t5 g
  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。1 X( v, x9 j6 W6 C, l% a
[编辑本段]二、智猪博弈理论* g, E, O2 E* U0 \' R5 Y- l' K' c
  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
9 ^/ H6 S' b, F0 C" ^  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 3 s0 X( M: g9 G) v0 W' P
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。   Y4 m  W  H1 m5 y, s- U2 y
  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 # q2 k+ U7 f* h/ J8 x
  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
3 T, H1 Y0 |3 U# C4 C# ]$ Y" k  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 9 A/ C0 @9 [4 I) y/ \6 r  @' g0 X$ e
  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
3 k7 Z) f- Y: N* Z6 b7 ^; Q  * c0 N+ N! K, E; c
三、关于企业价格策略  k; f+ e" L- s( G

% J0 T$ n, e1 p! d1 e+ K$ k0 X  
6 ^! c! H/ H) s# H# D+ T  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
, z2 ^9 n4 ~& J6 \4 v6 `- S  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);* c" z' u7 T5 c" Y8 x" L
  以下三个定义:2 d3 f; T; i2 p! |0 j4 Z: a
  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 ' |' O& S, |# U4 T) E& [! @$ G7 Z6 l
  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
( w8 V& s; F6 ?  所谓的双方优势策略则是指双方利益总和最大的策略。  # B8 Z  w1 s% J% F: r! ^
[编辑本段]严格优势策略举例分析
5 h0 g; a" f/ P; I4 e) [  一、经典的囚徒困境
3 I4 N, h- M8 k/ A3 H  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: + X7 L7 s0 q7 c$ L. g
  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
9 R1 Q" n$ j# S: j! F  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 $ |2 r; J! X- m' S. @# d& z' z( [; z
  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
6 ]5 O8 E" `. Y7 d  若二人都互相检举(互相“背叛”),则二人同样判监2年。1 P) J" S2 u0 M4 d
  + F& ]0 n& P  ?% l. T' c
用表格概述如下:) [& T, v: `  p+ X  f. M! f8 {* J# Y7 X% j
% ~( w+ V: }0 X) A
    甲沉默(合作)  甲认罪(背叛)  
) v$ Q& U8 E4 n/ s2 r4 G% Q3 [/ ?乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  
+ \$ u3 K- ]3 u$ N4 ~* j' y6 j+ L乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  " ?$ y' }% Z( M) |" y) k
; w' ^4 T6 ]4 z. Q+ z4 V
  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
; @# ~* _0 B, z9 i$ B; M$ w  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
2 @- w9 f6 |! I  z  若对方沉默、背叛会让我获释,所以会选择背叛。 4 w+ [3 k8 X6 j& b' G% t$ T
  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
# z* F7 P8 Z$ p3 A' U6 N' n  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
% L6 y. E/ L$ e2 Q1 ~9 ?( T1 D6 n  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 ! O' K- a& ?) S" C" l
  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
. `, |5 P: a4 x$ H[编辑本段]二、智猪博弈理论
1 h) D' p- W3 }6 m* d0 p8 {  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
# Y9 u9 I0 q8 Q8 Q  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 ( j2 T7 f: B, O% `
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
* }$ F* H) C7 K, U% y4 A  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
% H) b1 j1 M/ I6 g  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 - G5 T8 j$ g, s+ N% y. c
  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
! {" Q9 Y, n4 ~3 H+ a8 ?  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
3 q9 a* F3 K/ J+ H/ u$ I+ L  
  T! n2 }3 ?0 F7 k  L) [三、关于企业价格策略1 M3 e, x. r9 N: g4 Q

5 ]+ ]" k; v- L6 K+ e+ g' M  0 i* {8 Y- a: T$ Y, @! n) D6 M
  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
* m' _* n2 k9 H) N3 `  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
+ f$ r0 f" Z2 Z' F( F  以下三个定义:
- |  U1 ?, a2 U7 V5 e: K* ?  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 , Q1 J8 M4 E1 N3 f% _
  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
; P. z' {2 R+ ?1 Y8 x+ s% U  所谓的双方优势策略则是指双方利益总和最大的策略。  3 z- A6 F$ W4 G! D! x
[编辑本段]严格优势策略举例分析. ^4 q  j' @6 J+ f# z2 x, k
  一、经典的囚徒困境 * h2 `! ?# v" f/ J2 F- d  B
  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
, I0 J. n$ L6 ~( ~* K: e: l) O  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: & s! g  ^( p' U1 n' i% M: i
  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
8 @5 \; ~  T3 q* r2 o  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 ! Z* y; l9 O7 J3 J. d$ I8 }
  若二人都互相检举(互相“背叛”),则二人同样判监2年。
+ y' ^' q1 d. L% P" W  
: ]3 Z" t7 s* c( l用表格概述如下:1 C. i0 H4 J: ]1 R0 g2 F7 [5 `

2 L( D- N, v8 [6 Z- y8 }8 }1 P: @    甲沉默(合作)  甲认罪(背叛)  
* `$ R1 }, F( X& @# ~乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  $ d- s/ h6 n, `7 {1 }" J' v
乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  5 j0 y2 `& e! C9 B

# y* s* t5 S. R  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
9 L: d. y7 Y2 G8 V  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
6 t( `  K' q( Z1 C8 w( x  若对方沉默、背叛会让我获释,所以会选择背叛。
$ ?9 A  X$ ]& O  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
1 c8 H  C8 ?" ^9 _  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
- ~3 Q: z: y9 R) B" M  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 & t# q& |- W% Z( E: u3 n4 O5 W
  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。  g% \4 B9 Z( U& i2 V2 L  x' p% w
[编辑本段]二、智猪博弈理论
/ h( H- H4 J" i0 Y  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
6 |! Z' m; a. x- F4 y0 p1 V  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
( z4 ~) |& {9 u9 p& ~9 s2 a  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 0 j; _: X. R) A" n2 \+ {$ l" F
  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
8 C7 K$ A3 n9 n6 W9 B  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 4 y9 O8 \2 h6 J. y3 L! T
  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
! h, Q0 S  u- A. }* N5 h  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。$ i) p0 u$ x2 z
  6 j1 |4 h" S+ M
三、关于企业价格策略5 I6 ~1 a( F$ l1 F' m1 @
2 W& E! c% o2 n: S, |
  , q" V, \) x' y' x! [. O! b/ ]
  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? 8 x  Y9 `1 ~+ B6 a9 `$ F2 q
  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);( j( D7 v4 k! t! k3 M/ A. p
  以下三个定义:8 @" n4 U9 P" [* {9 a  r# b
  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 ; O3 k* Z; z1 M! c; m7 g* Z. l2 D/ D
  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
6 _0 l1 V9 C9 _* E  H) [  所谓的双方优势策略则是指双方利益总和最大的策略。  8 ~& {( ?  p% `$ T2 \2 N7 b# j$ k0 ~
[编辑本段]严格优势策略举例分析% f! u- j5 E$ Z1 d4 q. z3 y
  一、经典的囚徒困境   U! O6 N6 o! f( A& J& S
  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
! w, Z, k+ l  b( w) ]) T1 e3 u  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
( n( J4 l( @1 h* Y- c0 d* v  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 ! ~* _- o! `, b2 R# A! W
  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 ' I- g7 ?2 Z& Z% c9 ?
  若二人都互相检举(互相“背叛”),则二人同样判监2年。
$ T2 ~* l! a- g  ) L) P9 Y4 U- l4 U: e; z8 _( b
用表格概述如下:
* B, v. {' V5 a' y) B
. b$ X" X3 Y; M3 ]3 Y1 ~6 j% m    甲沉默(合作)  甲认罪(背叛)  2 S5 G7 I6 G' @) E
乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  1 m, t6 C" d( F: l, Y
乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  6 g) m4 ~& z) ]' ?1 m& ]
: A/ Z- h- X4 F4 S
  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 * Q, e% x  u2 g% n
  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
9 O" z" C9 C0 m, X1 r  若对方沉默、背叛会让我获释,所以会选择背叛。 + d. }: p) i7 x* r5 a3 A9 V$ I7 U2 @
  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 " i0 k4 s% T9 M0 R
  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 1 q* V; v& ]1 Y7 h
  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
* o8 m! Q7 u3 o+ E: ]  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。6 P1 M4 [& m: D6 @& F9 F
[编辑本段]二、智猪博弈理论
; |3 }5 h. O: U+ B: `  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
7 E& d) O3 l6 u2 }3 z+ c; s  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 1 e) f7 @! |6 Z* r" W7 e
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
3 W) G. o) t& g  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
- k: q8 g7 p! i' b+ x" ~$ ]& T  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 % A$ I+ l- n: i/ D' n
  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 % n3 \* y$ P- c, [7 t& N4 R5 n  J
  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
2 ?9 C& a$ _% x, D; o  
/ Z' [' a3 ?6 J# P三、关于企业价格策略
# a% N( `: z; ~& K8 V  l3 @
2 s4 B) Z/ [4 Y  s- b3 _- d( r  
: j+ X  T1 B9 c; H  w6 g  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? 6 ~0 S5 f& `) X& }
  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局
 
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则


0关注

14粉丝

9帖子

排行榜
作者专栏

关注我们:微信订阅号

官方微信公众号

客服个人微信号

全国服务热线:

0595-22880819

公司地址:泉州秘途文化传媒有限公司

运营中心:福建省泉州市

Email:506070961#qq.com

Copyright   ©2015-2025  老秘网 责任编辑:释然Powered by©Discuz!技术支持:秘途文化  备案号   ( 闽ICP备19022590号-1 闽公网安备35050302000919号 )