关灯
《文稿,还能这样写》作者雄文《笔杆子碎语》作者王一端《机关文稿写作入门》作者杨新宇《机关文字工作五十讲》作者何新国
最新《公文写作培训课程》直播间《公文写作百法例讲》作者房立洲老秘网站长、《老秘笔记》作者老猫《公文高手的自我修养》作者胡森林
开启左侧

人生有许多无耐

[复制链接]
lzqggg 发表于 2015-12-31 11:31:17 | 显示全部楼层 |阅读模式 打印 上一主题 下一主题
 
公文写作培训班
本帖最后由 lzqggg 于 2016-1-3 20:31 编辑
& @1 m* o% ^* f, B1 e4 o2 w
' B: G! L  Q$ i- M严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);7 l. U% `6 v" @( |
  以下三个定义:
5 `9 e, F/ N" ]! ]  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
5 y/ W- _! w" ~; \) @/ w  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 - H2 O( v* _& D/ h1 O; T! L  ]
  所谓的双方优势策略则是指双方利益总和最大的策略。  % @( A' g- v/ U% G
[编辑本段]严格优势策略举例分析4 y) G- ?  `( E! r
  一、经典的囚徒困境
( ]! u* ]) ?# W! P* s+ e  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
( Y. L8 S1 F! p3 f  X  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
9 T- G6 R7 k* y9 V# N  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 6 |3 e  V8 x  F0 ?" H8 d
  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 7 Q: J) |/ d3 T" r' B
  若二人都互相检举(互相“背叛”),则二人同样判监2年。
, n/ I1 C/ w# v* \  
2 x) B; t, L2 i0 p9 ~' N8 K( }8 y用表格概述如下:) p& B1 }! M& R, e
% B1 B0 Z. t& y  W) g+ F: w7 u
    甲沉默(合作)  甲认罪(背叛)  0 a, g. q! H9 H6 F1 R
乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  7 ~( I! {5 ~) w( U1 W' n
乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
' m3 q/ T" e6 q( C2 ^, ~$ W( x$ _) [7 {& V) p5 D6 w
  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
( p2 X, h* T: d3 G+ N  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
* _" y( `, \( c1 Y7 i" L  M  J  若对方沉默、背叛会让我获释,所以会选择背叛。 0 g0 T/ h8 a  |/ J
  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 ! f; s' R8 N, ~/ J% n
  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
/ y3 S5 u1 J, |: E  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 7 B2 j/ p# f$ q  g+ h
  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
  x% f; ]$ f, m/ m$ D5 J$ \[编辑本段]二、智猪博弈理论
# r2 p( I. A* D! {/ {1 N" }  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
4 B4 I* e, J( P2 ?5 N  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
: X# v8 P  z& r, w1 \" e, J* |1 t  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 , F: z( I' F) o
  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
; w8 A, I' W5 F  v2 H  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 , V$ q5 P) j) U3 o& h) `6 D8 V
  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
1 G# W+ X. n( M: h8 r+ H! `  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
, ~' r: n# d  E$ L+ p, u& y) M  3 I" E) G1 z! S) z# P
三、关于企业价格策略
' W/ G7 ]( E2 y8 M4 @
9 Z+ b' Q  p4 P8 l  
  G7 g# J, h5 r  {  E+ j! d  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
( z: T& X" E  R0 r7 b. s  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
# E$ J1 I) U& a, U, U. Z  以下三个定义:0 R* K* o" H3 p3 P
  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 ' t( g4 N/ D0 @# @
  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
  r% M( `8 ~1 h& X. n. o  所谓的双方优势策略则是指双方利益总和最大的策略。  
  w- s: O+ l2 ?9 D* m6 a6 `[编辑本段]严格优势策略举例分析. l" Y) k1 d0 P0 \# a' u3 i) C
  一、经典的囚徒困境
" B. q6 f0 D5 h3 z) ?2 c+ y  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: * V0 T8 W' ~# ?
  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
' E% @% n: N( D) ?% u3 P5 i* n* J  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 8 N+ `; |$ ]5 k; I9 r
  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
: R' L" B/ ~3 L( G+ o  若二人都互相检举(互相“背叛”),则二人同样判监2年。
7 F/ i' _6 I* L0 A  ; y; G& d7 ^4 i( ~
用表格概述如下:
: O% g! X( J  _0 K
1 Y5 @+ T, L( |. M8 b    甲沉默(合作)  甲认罪(背叛)  ; D4 n! c2 g4 o2 d. T( s
乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  
; l' m* N4 B, P5 x' e/ P乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
/ r' G1 O# c' c+ n3 a; h
3 b6 g' Y/ p9 J& ~* T" r  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
8 ^* x( B. t, d# Y, m  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: ; C3 z, c5 _2 I' e; j  s
  若对方沉默、背叛会让我获释,所以会选择背叛。
4 i  U1 {' d$ K! D/ Q; ]  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
* Y$ l! I% {3 i* @/ X: s! ?9 y( X  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
  X3 ?6 ]8 w- O7 t6 X  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
& P2 d- {1 z  Q* m3 v3 K4 n  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
# ~" s) Q( @* p7 d4 i[编辑本段]二、智猪博弈理论
* K; D8 c3 H: K' I0 r1 d  B4 p  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 4 j0 x2 j0 ~  G/ f
  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
* `* i% I" a: J( W4 e" _8 N  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 ; ?; ^/ V% c+ ^, p5 T/ ~
  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
7 _! R; L+ f! M0 A  t- d  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 8 J3 j' N! B0 u& g9 H9 ~* H
  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
8 p/ W) i( Y4 I7 M# x1 U: E  C  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
! k' D7 J6 r6 x& C$ n  
% c7 t- |; Y2 ^: d三、关于企业价格策略* v5 m3 X5 q, S' o+ ]0 d+ |

! M3 u  b2 @6 Z- S/ [  - \# b+ j! w2 O- {
  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? . o- p2 ^/ ?) A4 B$ H6 Y9 h
  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
* ]' h  A8 r! V* f( w6 c  以下三个定义:
5 {# g' E' U6 O& D( K  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 7 F) s. l9 M8 s; ~( B
  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 1 H2 u' U# f, o$ @. s
  所谓的双方优势策略则是指双方利益总和最大的策略。  * y- y2 P1 z, l1 ]
[编辑本段]严格优势策略举例分析& L& [; T8 p% R, Y4 K% s' S; f( l
  一、经典的囚徒困境
# m4 i2 c3 t/ z' o/ N  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: % i) {0 x( R  `$ I. K
  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: . @6 e( y+ E$ K' }" i0 t! G7 [: e
  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 , Y; T! o4 T# q8 U  r; y. ?
  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 3 x* ~' z7 i9 A" s. L3 O
  若二人都互相检举(互相“背叛”),则二人同样判监2年。
4 t3 |1 X2 f+ y0 s. ~  & k6 {5 O: A2 Y0 \9 b1 O+ o
用表格概述如下:
$ u$ S- `$ C& ?- }3 N  h4 W6 V! x) j0 J" b' i. o
    甲沉默(合作)  甲认罪(背叛)  " S4 F8 e) L; A) g5 g8 `5 N
乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  
1 O3 h. h. Y3 e8 ~  M乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
- W+ R# a  K% Z4 C/ L8 k) `( u9 y$ g2 v4 W* A  Y
  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 , m' Y; N5 X( Q% E
  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
9 s( X: `; ~4 _& e( Y0 P  若对方沉默、背叛会让我获释,所以会选择背叛。 8 z3 ^0 X9 q+ `# G2 g
  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 ) P1 O1 R4 U. w/ p$ g7 z: \
  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
" h: _, N. O' {: I, ]# t4 M; |  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
) _7 J- ^' b; @) O9 W  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。3 p6 \2 j4 \8 w0 x" h
[编辑本段]二、智猪博弈理论8 @# P5 `% j5 ?& x# e8 y
  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
- K5 s4 }! p! M  P1 Z* B  @  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
9 _. B  w# P8 g1 _) E! o  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 8 N9 ~1 p* L- h/ H( ^  o! f
  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
3 Z2 J/ w. A+ m6 E0 w  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
8 ^2 [& }6 A& o: O7 U) v  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 ) ]7 K0 t7 q1 O
  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
! t5 H. y/ w. w4 O  
* `, U/ Y' ~% G  }三、关于企业价格策略- M9 L+ [( e/ @5 t' U% Z
! v3 B  y. Z# s' s
  0 |# ]6 c) z) ?7 G9 l
  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? 0 x+ h" E5 r; B8 x% h3 p, V) z8 W
  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);9 ?; Y3 |; f/ d& c: M/ F- `
  以下三个定义:0 |+ q6 |" m2 i2 l
  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 3 @1 ~% D* V4 U2 ?
  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
" L6 X# g2 [; A% _* o1 ^6 K, Q0 c  所谓的双方优势策略则是指双方利益总和最大的策略。  
3 Y1 N* Y. [! x- B, Z[编辑本段]严格优势策略举例分析
7 J! J( S& [$ U2 I  一、经典的囚徒困境
7 g. O) S+ C6 K, y  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: 9 u4 @/ A& g. A& R& t
  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
9 g# a8 ~& v3 C8 l, d9 I  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
. e' X/ o5 x  {! O% ~; A' b7 U  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
% l2 [8 k# T8 A6 d  若二人都互相检举(互相“背叛”),则二人同样判监2年。6 `, P' t' C7 |$ O$ N/ R
  
. n+ m" k$ ^+ o用表格概述如下:7 I8 H4 |; n- X
: o: w  R: z( {# d% [
    甲沉默(合作)  甲认罪(背叛)  & V* O  d! j: @$ \, e: A) b
乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  + v5 ]/ h/ U  T$ x* q% o
乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  ! [' C( y' K" [6 @5 [
- H; c) Y% R4 Y# i( m$ u, Q
  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
# y: x( y/ ?' x' @. n; A  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: $ d. O. n* {% B8 C0 j
  若对方沉默、背叛会让我获释,所以会选择背叛。
7 x3 S% E: l/ \6 x  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 3 z$ @5 x$ f4 J! n6 j& p1 g
  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 ' G/ A9 b: v6 D  L, ^; m7 G7 O, ?
  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
: b: `1 y: @; [  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。) }" u+ J0 R- A7 ^7 g+ }
[编辑本段]二、智猪博弈理论
9 X- I! s( `. z3 A" [( B$ X: n. e  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
' A6 N4 Y( x4 u! T/ K5 {  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 6 `( Z5 Y2 K, ]1 F
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
/ d, T9 ]: h4 o2 Y  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 9 I& r6 }( _" @/ w, \4 \0 |0 b0 u
  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 * p9 u( E) g/ A
  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
5 q0 I9 H* M* R4 f; _3 P2 K  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。* M1 l% b' Z; |
  ! [# g6 i7 [  K& M
三、关于企业价格策略) Q% s, Q) ?; k8 b8 z
" I2 c! G5 l+ A; n
  4 V% O) Z5 ~# T
  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? ! ?$ z# a' y, N; A0 `2 G+ x. H
  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局
 
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则


0关注

14粉丝

9帖子

排行榜
作者专栏

关注我们:微信订阅号

官方微信公众号

客服个人微信号

全国服务热线:

0595-22880819

公司地址:泉州秘途文化传媒有限公司

运营中心:福建省泉州市

Email:506070961#qq.com

Copyright   ©2015-2025  老秘网 责任编辑:释然Powered by©Discuz!技术支持:秘途文化  备案号   ( 闽ICP备19022590号-1 闽公网安备35050302000919号 )