MOOC-浙江大学-博弈论基础-学习笔记(四)

第三讲 囚徒困境和**之道

对应 书中的第五、六、七章,囚犯困境及原因、真实世界的囚犯困境、如何走出囚犯困境。

1.囚徒困境的来源

MOOC-浙江大学-博弈论基础-学习笔记(四)

“囚徒困境”是1950年美国兰德公司的梅里尔·弗勒德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问艾伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。

两个共谋犯罪的人被关入*,不能互相沟通情况。如果两个人都不揭发对方,则由于证据不确定,每个人都坐牢一年;若一人揭发,而另一人沉默,则揭发者因为立功而立即获释,沉默者因不合作而入狱五年;若互相揭发,则因证据确实,二者都判刑两年。
由于囚徒无法信任对方,因此倾向于互相揭发,而不是同守沉默。

囚徒困境(*er’s dilemma ):两个被捕的囚徒之间的一种特殊博弈,说明为什么甚至在合作对双方都有利时,保持合作也是困难的。

囚徒困境是博弈论的非零和博弈中具代表性的例子,反映个人最佳选择并非团体最佳选择。虽然困境本身只属模型性质,但现实中的价格竞争、环境保护等方面,也会频繁出现类似情况。

类似的,攻守同盟(承诺博弈)提前商量好,依然不管用,坦白与否变成了遵守承诺与否。

类似的,还有说谎博弈。
如果确实是没做过,没达到,是否就一定会坦白?

实例:
放卫星事件:放卫星,指的是从1958年开始的、在“*”中的、一场急于求成的*建设悲情运动。在“*”中各地浮夸风盛行,虚报夸大宣传粮食产量,这些上报虚假“小麦卫星”、“水稻卫星”、“包谷卫星”、“烤烟卫星”等在各行各业中发生的类似行为被统一称为“放卫星”。
你放,别人不放,你就得到提拔了。
别人放,你不放,你就被免职了。
那么,你是放,还是不放?

类似的还有偷懒博弈。
例如:人民公社的偷懒博弈(即:偷懒的收益是独享的,偷懒的损失是共同承担。)
你是偷懒,还是不偷懒?

两个概念:

占优策略:

是指无论其他参与者采取什么策略,某参与者采用该策略的结果都优于其他策略。

占优策略均衡:

是指由博弈中的所有参与者的占优策略组合所构成的均衡。

参照囚徒困境,在无法信任彼此的情况下,坦白是各自的占优策略。

特别提示:

很多时候均衡的结果跟事实真相没有关系。
游戏规则决定游戏的结局。

2.囚犯困境的定义及原因分析

一般条件下的囚犯困境
MOOC-浙江大学-博弈论基础-学习笔记(四)
(1)一般条件下的囚犯困境
1、双方都有占优策略,即:
a1>a3,a2>a4,b1>b2,b3>b4
在a1>a3,a2>a4的条件下,张三选择背叛是占优策略;
在b1>b2,b3>b4的条件下,李四选择背叛是占优策略。
2、存在一个合作解,使双方的收益都优于其 在占优策略均衡下的收益, 即: a1<a4,b1<b4

如果双方能够选择合作,本可以得到更好的结果。

(2) 对称条件下的囚犯困境
MOOC-浙江大学-博弈论基础-学习笔记(四)
在一个2人双策略对称博弈中,如果满足以下条件:P>S>R>T,那么其占优策略均衡(R,R)就构成了囚犯困境。(个人理性与集体非理性)

囚徒困境的原因分析:

表面上看,囚犯对自身利益的追求是导致囚犯困境的原因,
其实,真正的原因是:囚犯们在追求自身利益的同时,以更多的损害他人利益为代价。

君子爱财,取之以道

囚犯困境的根本原因在于:私人成本与社会成本的差异,即个人行为的负外部性。

负外部性,也称外部成本或外部不经济,是指一个人的行为或企业的行为影响了其他人或企业,使之支付了额外的成本费用,但后者又无法获得相应补偿的现象。或是对交易双方之外的第三者所带来的未在价格中得以反映的成本费用。
例如:汽车废气,对车本身是好的,但是对于他人而言是烟雾。

相反的,还有正外部性。
例如:修复历史建筑

特别提示:
损人利已和损己利人本质上是一样的,是一个硬币的正反两面;从一方面来看是损己利人的行为,在另一方来看是损人利已的行为,问题的关键是所损(失)的部分和所利(得)的部分哪个更多。

盗窃与抢劫,一线之隔。

如果有一种制度,在该制度下,每个人都只能通过利人才能实现利己的目标,这一定是一种好的制度。(市场的逻辑)

最近,蚂蚁森林的给好友浇水得双十一码,是一种好的游戏规则。

3.真实世界的囚犯困境

① 经济大萧条;
② 价格战(货比三家);
③ *与多数人的懦弱;
④ *与多数人的暴政(*必须与法治(不是法制)相辅相成,才能避免多数人的暴政。法治:rule of law;法制:rule by law)
eg:希特勒的上台

美国波士顿犹太人纪念碑上,一段德国新教神父马丁·尼莫拉的忏悔:
起初他们追杀共产主义者,
我不是共产主义者,
我不说话;
接着他们追杀犹太人,
我不是犹太人,
我不说话;
后来他们追杀工会成员,
我不是工会会员,
我继续不说话;
此后他们追杀天主教徒,
我不是天主教徒,
我还是不说话;
最后,他们奔我而来,
------这时再没有人站起来为我说话了。

联想近日的重庆万州公交车坠江案,公交车上的其他乘客是否需要站起来说话?

4.如何**囚徒困境

4.1 如何利用他人的囚犯困境
① 货比三家 --选择最优价格
② 分而治之 --保有权力

4.2 如何**囚犯困境
① 道德教化(文化建设)

社会学基本定理
金迪斯(H. Gintis) :如果一个社会都是由自利主义者构成的,那么,长期而言,这个社会将消亡。而如果一个社会,通过“说服教育”以及其他说教机构的努力,长期保持一定比例的利他主义者,它就能够稳定地繁衍下去。((罗森塞蜈蚣博弈(Rosenthsal,1981)))
② 财产私有(制度建设)
圈地运动(土地70年产权) <–> 人民公社的消亡 (两个相反的案例)
③ 温故知新
让历史告诉未来(重复博弈)

特别提问:

1.你愿意被搭便车吗?
2.搭便车后,你愿意给对方费用吗?
3.如何让别人愿意和你合作?