关灯
《文稿,还能这样写》作者雄文《笔杆子碎语》作者王一端《机关文稿写作入门》作者杨新宇《机关文字工作五十讲》作者何新国
最新《公文写作培训课程》直播间《公文写作百法例讲》作者房立洲老秘网站长、《老秘笔记》作者老猫《公文高手的自我修养》作者胡森林
开启左侧

人生有许多无耐

[复制链接]
lzqggg 发表于 2015-12-31 11:31:17 | 显示全部楼层 |阅读模式 打印 上一主题 下一主题
 
公文写作培训班
本帖最后由 lzqggg 于 2016-1-3 20:31 编辑 7 U: g7 |3 q: d) `3 F  G6 N
# {! L" q* @6 w
严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);  _1 x* |: B) u$ R8 u4 x# q
  以下三个定义:
+ k3 ]6 N0 v$ j: B0 I  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 * [+ k( Y' _7 |
  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 4 Y: [. h3 c* [0 u, {+ ^4 @1 O
  所谓的双方优势策略则是指双方利益总和最大的策略。  
# m5 D2 [# T, P. |0 a[编辑本段]严格优势策略举例分析3 M" ]3 J" h- N
  一、经典的囚徒困境
) D4 }0 S2 v; C) H+ I( p* z  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: , P3 i* s, T. X9 ^
  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: . K% X4 `$ q5 [# J' @/ R8 A9 @
  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 ' e: a3 ?' ^# w4 g1 p
  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
! y' V- f. [4 w  若二人都互相检举(互相“背叛”),则二人同样判监2年。
2 ^3 ]- `+ ^6 S2 }( w  + z- h: W$ e: K6 a9 A$ d+ g
用表格概述如下:
) R# [( K6 `7 S" R; V$ |/ @7 H& F5 B  U" `# Q
    甲沉默(合作)  甲认罪(背叛)  
. ^  B- I8 c, O0 v3 L5 q6 r乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  
( d2 U8 M% N% U) l' U% _乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
& ]: S6 K# X5 d' A0 B- c, s& Z" ~7 g: L0 r( c
  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
5 G; A6 k" D0 m8 L$ O) x8 m  [) Q  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
8 _) h3 P9 A, n2 u  若对方沉默、背叛会让我获释,所以会选择背叛。 : z" o/ R9 j! h! d2 I$ s4 O
  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。   u4 l$ M! U4 m0 X6 o
  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 9 {$ y+ B% t) y$ V. a
  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
" ]5 j3 b4 ?+ Z3 R- \  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
5 k7 \! O' b9 e1 q' m( w[编辑本段]二、智猪博弈理论8 ^0 z3 ]7 p6 R3 k- v: w
  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 ' e: G7 V. L5 }1 [4 ~/ a) m, e" \8 i
  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 4 |: v+ a8 r, f1 ]2 L' w8 P
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 1 ], Q* T- g( u0 D0 D& R2 l
  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 & H: c5 U8 l+ }
  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 / M0 V  R* D) P
  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
  C2 E+ k5 @5 u8 @3 T  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
: W6 |$ a3 H$ U. z' w7 p% T% ?* f8 O  
' z9 Z+ _. ]. k三、关于企业价格策略; R" Q0 E& T: O6 @

/ \; p0 n3 R; b! T  
5 x' B6 ~; Y" d1 @( K  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? ( u' i* G3 y. r1 O
  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);  \( \, D# Z# @
  以下三个定义:# H( H! |0 U; ?) A+ w8 [9 U
  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 ( S" ?# F! N: B% s
  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
0 N1 E2 N: C9 q: U, d# h9 N  所谓的双方优势策略则是指双方利益总和最大的策略。  
8 x- U; v7 R# Y. S[编辑本段]严格优势策略举例分析: Z% b) }+ S  n3 g: v
  一、经典的囚徒困境
& A1 Z7 s3 ]/ X$ `7 R  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
  T( Y+ \7 l6 B- K  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
* O9 F$ ?2 ~) t' G; [& H  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
3 u* V5 d' S3 g4 t) S* t  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 & v, s. A: o5 o0 i
  若二人都互相检举(互相“背叛”),则二人同样判监2年。$ L1 m, }; f* ^3 @9 }
  6 `0 W( R2 t/ R7 \0 v5 G
用表格概述如下:' h0 [) u8 I1 e' K3 X! `! G; V( z
$ p7 g" I( R# K; F$ U" Y
    甲沉默(合作)  甲认罪(背叛)  
3 W9 l' J: s+ @# D3 {0 j* y乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  
" l3 ]5 {) I' B, W4 X9 _5 `9 ]# d7 B& z乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
, U; q+ t: o( t# X% @. H5 X
: j! z9 Y+ b# A  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
% z7 r+ j( Z' C# |  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
! k8 r' W# R0 t3 ]& J9 u  若对方沉默、背叛会让我获释,所以会选择背叛。
1 X4 c, G6 v& Q. r. \( y  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 , X/ |1 \2 ~8 \0 l* F7 H
  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 0 k- d) i. `7 k5 Q4 t1 w
  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
& A# J- [0 K( w2 A1 b) ?4 f  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
2 X4 ^" a4 R- V[编辑本段]二、智猪博弈理论
3 ^! P( \, s8 P3 |4 x  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 9 ?. B4 n7 h+ z. z; q. s
  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
! F4 Q, o9 U$ ]  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
( o0 Q9 J- N: h2 n) o  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
6 U% q! N0 K. Y* W0 g) o) Q5 i- f  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
; _; X# ^  e1 B2 _) O1 A* U2 F) T  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 0 s5 F3 X: d/ N- w; H
  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
, w0 u% I1 {4 f& B  ' h4 ?2 k4 O5 H& n" Q
三、关于企业价格策略
; C$ w2 W& L: }: ^& M6 ~  h) t" z$ |1 I
  0 @2 e+ S) y, B- o2 H& ^
  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? $ E5 q1 e9 q- i6 [# ~2 n5 ~" A5 y
  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
* U+ p& j, _2 P7 x+ t  以下三个定义:/ `0 R2 Z8 z+ z0 ]
  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
4 j4 w  n; Y+ O0 R, k4 X; z  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 $ I  V7 l! ]" ]; d  @
  所谓的双方优势策略则是指双方利益总和最大的策略。  
/ y0 [. x" F2 C7 F0 r$ d[编辑本段]严格优势策略举例分析
& Z- e2 Z$ _- o/ q2 V2 Z  一、经典的囚徒困境
& I) ]7 u- w- d( N  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: . k, Y  h, {8 q) `
  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
4 P- D2 w# y, Q) x! e3 t  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 + E3 n1 p+ z! u7 C
  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
+ T8 f. ^5 r( X; |! n  若二人都互相检举(互相“背叛”),则二人同样判监2年。* T8 @. i! h' L# t; u9 p* i
  $ E; `4 Q% f1 ^/ P1 [+ C
用表格概述如下:
9 m$ t+ E; c+ Z8 ~
' B2 H  z8 K7 u  c6 ?( _% r+ _    甲沉默(合作)  甲认罪(背叛)  2 C& w' U2 N7 A9 @
乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  
! q: u$ W# v( l: B( [7 k' b/ d乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
& Q9 B! T. ^9 H% }9 H& D3 z2 o' N9 B  D# w; Z$ K
  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 0 K1 B/ z" y' ?) B6 s$ f* o, k
  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
* ~! b6 n( |) D. Q7 d; x  若对方沉默、背叛会让我获释,所以会选择背叛。 6 D, f% v: e- r* t8 c
  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
6 I* A6 l1 W  {! \' f  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
5 `; F9 H. y: O: s5 z( a. _* _8 {  ?6 I  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
, e4 X0 G: H' R# V  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。+ Y0 ^, _. X2 ?8 r( X2 f
[编辑本段]二、智猪博弈理论
+ E" @3 e  X% k. {  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
. @2 {' G. N! q6 R3 L  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 5 H- D0 `. o' O" p" u) E7 V
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 ! S7 U2 l6 s2 T8 @. n; \; ~: ]
  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
9 [/ O0 A8 t4 n5 X) T' {; C  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
- B8 M* q2 H$ {8 B  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 " P: D2 `7 N3 v4 B# y
  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。0 d8 ?8 T; I/ U+ K
  
& n% t2 ~0 I; L5 ?& N三、关于企业价格策略# G" M" _% a3 T4 K8 r, w2 [$ A
0 H  o! t# S5 O' U+ T  m8 {
  / h1 ~  `! e4 g* H' U3 y+ T, W* E
  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
# }% j! Y0 _4 `0 G  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
9 {' j/ U  ]' @6 M3 R- p; M- ~  以下三个定义:) a" ?# Z/ q. d4 f8 L4 T
  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
0 w- U8 l% ^, C- r  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
) Y" A, M( `/ H- Q, l  所谓的双方优势策略则是指双方利益总和最大的策略。  
6 D1 B* m1 `9 n[编辑本段]严格优势策略举例分析
# i. P2 }- b' }0 E' u  一、经典的囚徒困境 ) Y) N6 B+ G) v) s* `. g
  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
! O0 b- ]- P) t5 _  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: 1 ^, g8 t' @( A" [7 F
  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 % K" e, Y$ ?/ R& |) }, P; [) ?2 W
  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
4 `$ m2 |  s& O( L4 m9 x  若二人都互相检举(互相“背叛”),则二人同样判监2年。5 C& A2 Q( C  w/ x
  9 l0 i# g. h" t7 p/ `
用表格概述如下:
* ?' @, W' Y. G0 v) P7 v) e8 D4 d. I4 h8 [% W& l, F2 D
    甲沉默(合作)  甲认罪(背叛)  0 g" I1 c4 H) q& z
乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  
5 {4 ^/ E+ k5 n; K0 l; D: q乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
3 ?+ ?# n" s8 u
8 N+ U* V4 f& ^  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
  q2 X4 N  G6 W; T9 I9 R! N  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: ' ~7 m4 k! X8 d4 d6 b
  若对方沉默、背叛会让我获释,所以会选择背叛。 & v% ^9 p, L& h* u5 j
  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。   X/ D1 U$ z' [/ f, ]. ]; [0 @+ @
  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 % S8 h! I5 R' a& R% P4 x, b
  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 : E/ E/ u& N1 d, Y+ _2 z; u
  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。4 C; z6 a5 L0 ^
[编辑本段]二、智猪博弈理论
& c- M. W9 ^- e3 ^  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
: v: ]6 k$ |/ W- J  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 0 H- ~& d6 k7 v; x
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
# g" ]9 q2 f: U5 P; D8 L+ r# U1 K  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 % V4 D# ]7 Z  [* G7 ?
  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 + [8 F* w. A. a4 o- c; H% j
  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
8 z; Z5 l8 p& Q  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。" }7 [, I, S, ^# J; c# Q/ E* H
  $ F( c1 V" E5 |2 _6 g  ~6 L
三、关于企业价格策略: V3 y& C7 o% l. R3 t

+ f  ~- d1 C0 ]" A; u$ ~7 f  
4 B- h  C9 r5 ]1 [- @, H  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? * O  H- g* g$ E: H; w! ^; K5 X& [
  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局
 
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则


0关注

14粉丝

9帖子

排行榜
作者专栏

关注我们:微信订阅号

官方微信公众号

客服个人微信号

全国服务热线:

0595-22880819

公司地址:泉州秘途文化传媒有限公司

运营中心:福建省泉州市

Email:506070961#qq.com

Copyright   ©2015-2025  老秘网 责任编辑:释然Powered by©Discuz!技术支持:秘途文化  备案号   ( 闽ICP备19022590号-1 闽公网安备35050302000919号 )