本帖最后由 lzqggg 于 2016-1-3 20:31 编辑 7 U: g7 |3 q: d) `3 F G6 N
# {! L" q* @6 w
严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy); _1 x* |: B) u$ R8 u4 x# q
以下三个定义:
+ k3 ]6 N0 v$ j: B0 I 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 * [+ k( Y' _7 |
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 4 Y: [. h3 c* [0 u, {+ ^4 @1 O
所谓的双方优势策略则是指双方利益总和最大的策略。
# m5 D2 [# T, P. |0 a[编辑本段]严格优势策略举例分析3 M" ]3 J" h- N
一、经典的囚徒困境
) D4 }0 S2 v; C) H+ I( p* z 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: , P3 i* s, T. X9 ^
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: . K% X4 `$ q5 [# J' @/ R8 A9 @
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 ' e: a3 ?' ^# w4 g1 p
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
! y' V- f. [4 w 若二人都互相检举(互相“背叛”),则二人同样判监2年。
2 ^3 ]- `+ ^6 S2 }( w + z- h: W$ e: K6 a9 A$ d+ g
用表格概述如下:
) R# [( K6 `7 S" R; V$ |/ @7 H& F5 B U" `# Q
甲沉默(合作) 甲认罪(背叛)
. ^ B- I8 c, O0 v3 L5 q6 r乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
( d2 U8 M% N% U) l' U% _乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
& ]: S6 K# X5 d' A0 B- c, s& Z" ~7 g: L0 r( c
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
5 G; A6 k" D0 m8 L$ O) x8 m [) Q 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
8 _) h3 P9 A, n2 u 若对方沉默、背叛会让我获释,所以会选择背叛。 : z" o/ R9 j! h! d2 I$ s4 O
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 u4 l$ M! U4 m0 X6 o
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 9 {$ y+ B% t) y$ V. a
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
" ]5 j3 b4 ?+ Z3 R- \ 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
5 k7 \! O' b9 e1 q' m( w[编辑本段]二、智猪博弈理论8 ^0 z3 ]7 p6 R3 k- v: w
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 ' e: G7 V. L5 }1 [4 ~/ a) m, e" \8 i
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 4 |: v+ a8 r, f1 ]2 L' w8 P
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 1 ], Q* T- g( u0 D0 D& R2 l
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 & H: c5 U8 l+ }
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 / M0 V R* D) P
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
C2 E+ k5 @5 u8 @3 T 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
: W6 |$ a3 H$ U. z' w7 p% T% ?* f8 O
' z9 Z+ _. ]. k三、关于企业价格策略; R" Q0 E& T: O6 @
/ \; p0 n3 R; b! T
5 x' B6 ~; Y" d1 @( K 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? ( u' i* G3 y. r1 O
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy); \( \, D# Z# @
以下三个定义:# H( H! |0 U; ?) A+ w8 [9 U
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 ( S" ?# F! N: B% s
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
0 N1 E2 N: C9 q: U, d# h9 N 所谓的双方优势策略则是指双方利益总和最大的策略。
8 x- U; v7 R# Y. S[编辑本段]严格优势策略举例分析: Z% b) }+ S n3 g: v
一、经典的囚徒困境
& A1 Z7 s3 ]/ X$ `7 R 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
T( Y+ \7 l6 B- K 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
* O9 F$ ?2 ~) t' G; [& H 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
3 u* V5 d' S3 g4 t) S* t 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 & v, s. A: o5 o0 i
若二人都互相检举(互相“背叛”),则二人同样判监2年。$ L1 m, }; f* ^3 @9 }
6 `0 W( R2 t/ R7 \0 v5 G
用表格概述如下:' h0 [) u8 I1 e' K3 X! `! G; V( z
$ p7 g" I( R# K; F$ U" Y
甲沉默(合作) 甲认罪(背叛)
3 W9 l' J: s+ @# D3 {0 j* y乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
" l3 ]5 {) I' B, W4 X9 _5 `9 ]# d7 B& z乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
, U; q+ t: o( t# X% @. H5 X
: j! z9 Y+ b# A 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
% z7 r+ j( Z' C# | 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
! k8 r' W# R0 t3 ]& J9 u 若对方沉默、背叛会让我获释,所以会选择背叛。
1 X4 c, G6 v& Q. r. \( y 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 , X/ |1 \2 ~8 \0 l* F7 H
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 0 k- d) i. `7 k5 Q4 t1 w
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
& A# J- [0 K( w2 A1 b) ?4 f 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
2 X4 ^" a4 R- V[编辑本段]二、智猪博弈理论
3 ^! P( \, s8 P3 |4 x 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 9 ?. B4 n7 h+ z. z; q. s
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
! F4 Q, o9 U$ ] 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
( o0 Q9 J- N: h2 n) o 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
6 U% q! N0 K. Y* W0 g) o) Q5 i- f “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
; _; X# ^ e1 B2 _) O1 A* U2 F) T 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 0 s5 F3 X: d/ N- w; H
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
, w0 u% I1 {4 f& B ' h4 ?2 k4 O5 H& n" Q
三、关于企业价格策略
; C$ w2 W& L: }: ^& M6 ~ h) t" z$ |1 I
0 @2 e+ S) y, B- o2 H& ^
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? $ E5 q1 e9 q- i6 [# ~2 n5 ~" A5 y
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
* U+ p& j, _2 P7 x+ t 以下三个定义:/ `0 R2 Z8 z+ z0 ]
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
4 j4 w n; Y+ O0 R, k4 X; z 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 $ I V7 l! ]" ]; d @
所谓的双方优势策略则是指双方利益总和最大的策略。
/ y0 [. x" F2 C7 F0 r$ d[编辑本段]严格优势策略举例分析
& Z- e2 Z$ _- o/ q2 V2 Z 一、经典的囚徒困境
& I) ]7 u- w- d( N 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: . k, Y h, {8 q) `
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
4 P- D2 w# y, Q) x! e3 t 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 + E3 n1 p+ z! u7 C
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
+ T8 f. ^5 r( X; |! n 若二人都互相检举(互相“背叛”),则二人同样判监2年。* T8 @. i! h' L# t; u9 p* i
$ E; `4 Q% f1 ^/ P1 [+ C
用表格概述如下:
9 m$ t+ E; c+ Z8 ~
' B2 H z8 K7 u c6 ?( _% r+ _ 甲沉默(合作) 甲认罪(背叛) 2 C& w' U2 N7 A9 @
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
! q: u$ W# v( l: B( [7 k' b/ d乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
& Q9 B! T. ^9 H% }9 H& D3 z2 o' N9 B D# w; Z$ K
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 0 K1 B/ z" y' ?) B6 s$ f* o, k
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
* ~! b6 n( |) D. Q7 d; x 若对方沉默、背叛会让我获释,所以会选择背叛。 6 D, f% v: e- r* t8 c
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
6 I* A6 l1 W {! \' f 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
5 `; F9 H. y: O: s5 z( a. _* _8 { ?6 I 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
, e4 X0 G: H' R# V 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。+ Y0 ^, _. X2 ?8 r( X2 f
[编辑本段]二、智猪博弈理论
+ E" @3 e X% k. { 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
. @2 {' G. N! q6 R3 L 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 5 H- D0 `. o' O" p" u) E7 V
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 ! S7 U2 l6 s2 T8 @. n; \; ~: ]
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
9 [/ O0 A8 t4 n5 X) T' {; C “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
- B8 M* q2 H$ {8 B 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 " P: D2 `7 N3 v4 B# y
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。0 d8 ?8 T; I/ U+ K
& n% t2 ~0 I; L5 ?& N三、关于企业价格策略# G" M" _% a3 T4 K8 r, w2 [$ A
0 H o! t# S5 O' U+ T m8 {
/ h1 ~ `! e4 g* H' U3 y+ T, W* E
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
# }% j! Y0 _4 `0 G 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
9 {' j/ U ]' @6 M3 R- p; M- ~ 以下三个定义:) a" ?# Z/ q. d4 f8 L4 T
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
0 w- U8 l% ^, C- r 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
) Y" A, M( `/ H- Q, l 所谓的双方优势策略则是指双方利益总和最大的策略。
6 D1 B* m1 `9 n[编辑本段]严格优势策略举例分析
# i. P2 }- b' }0 E' u 一、经典的囚徒困境 ) Y) N6 B+ G) v) s* `. g
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
! O0 b- ]- P) t5 _ 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: 1 ^, g8 t' @( A" [7 F
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 % K" e, Y$ ?/ R& |) }, P; [) ?2 W
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
4 `$ m2 | s& O( L4 m9 x 若二人都互相检举(互相“背叛”),则二人同样判监2年。5 C& A2 Q( C w/ x
9 l0 i# g. h" t7 p/ `
用表格概述如下:
* ?' @, W' Y. G0 v) P7 v) e8 D4 d. I4 h8 [% W& l, F2 D
甲沉默(合作) 甲认罪(背叛) 0 g" I1 c4 H) q& z
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
5 {4 ^/ E+ k5 n; K0 l; D: q乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
3 ?+ ?# n" s8 u
8 N+ U* V4 f& ^ 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
q2 X4 N G6 W; T9 I9 R! N 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: ' ~7 m4 k! X8 d4 d6 b
若对方沉默、背叛会让我获释,所以会选择背叛。 & v% ^9 p, L& h* u5 j
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 X/ D1 U$ z' [/ f, ]. ]; [0 @+ @
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 % S8 h! I5 R' a& R% P4 x, b
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 : E/ E/ u& N1 d, Y+ _2 z; u
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。4 C; z6 a5 L0 ^
[编辑本段]二、智猪博弈理论
& c- M. W9 ^- e3 ^ 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
: v: ]6 k$ |/ W- J 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 0 H- ~& d6 k7 v; x
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
# g" ]9 q2 f: U5 P; D8 L+ r# U1 K 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 % V4 D# ]7 Z [* G7 ?
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 + [8 F* w. A. a4 o- c; H% j
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
8 z; Z5 l8 p& Q 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。" }7 [, I, S, ^# J; c# Q/ E* H
$ F( c1 V" E5 |2 _6 g ~6 L
三、关于企业价格策略: V3 y& C7 o% l. R3 t
+ f ~- d1 C0 ]" A; u$ ~7 f
4 B- h C9 r5 ]1 [- @, H 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? * O H- g* g$ E: H; w! ^; K5 X& [
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局 |