囚徒困境
前言
囚徒困境大家都知道吗?
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人有罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
- 若一人认罪并作证检控对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
- 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
- 若二人都互相检举(互相“背叛”),则二人同样判监5年。
表格解释如下
乙沉默(合作) | 乙认罪(背叛) | |
---|---|---|
甲沉默(合作) | 二人同服刑半年 | 甲服刑10年;乙即时获释 |
甲认罪(背叛) | 甲即时获释;乙服刑10年 | 二人同服刑5年 |
解
我们定
- 一人背叛、一人合作:背叛者得5分(背叛诱惑),合作者0分(受骗支付)。
- 二人都合作:各得3分(合作报酬)。
- 二人都背叛:各得1分(背叛惩罚)。
那么矩阵表格就是:
甲(合作) | 甲(背叛) | |
---|---|---|
乙(合作) | 3,3 | 0,5 |
乙(背叛) | 5,0 | 1,1 |
若以T(Temptation)=背叛诱惑,R(Reward)=合作报酬,P(Punishment)=背叛惩罚,S(Suckers)=受骗支付,以个人选择得分而言,可得出以下不等式。
T>R>P>S
(解:从5>3>1>0获得以上不等式)
若以整体获分而言,将得出以下不等式。
2R>T+S或2R>2P
(解:2×3>5+0或2×3>2x1;合作2人共得6分,比起互相背叛的共得2分及单独背叛的共得5分,显然合作获分比背叛高。合作在团体而言是支配性策略。)
而重复博弈或重复的囚徒困境将会使参与者从注重T>R>P>S转变成注重2R>T+S。就是说将使参与者脱离困境。
(以上理论是道格拉斯·霍夫施塔特创建的。)
理想解
从上面的解可以看出,两人在合作的时候,获得的分数是最高的(合作2人共得6分)
这样才是收益最大化的最优解。
实际结果
但是呢,人,是一种自私的生物,如果只顾自己的收益最大化,应该会这么选呢?
虽然合作两人共得6分,但每人只有3分
若是背叛对方,就有可能获得5分
那么有没有办法让自己利益最大化的概率提高呢?
有的,那就是利用对方的信任,最开始和对方商量好,只要都合作,就可以利益最大化
然后在实际进行的时候,因为相信对方一定会选则合作,这个时候选择背叛,就能将自己的收益从3提高到5
如果这个时候对方也是这么想的呢?那么结果就会是两人都选择背叛,两位囚犯一起判5年
如果两人一开始就没考虑过会自己会遇到这种问题,从一开始没有商量过这么办,会出现什么结果呢?
虽然说理想解是两人都选择合作
如果甲选择合作,那么甲的最低收益是0,最高收益是3
如果甲选择背叛,那么甲的最低收益是1,最高收益是5 只顾自己的情况下,甲是会选中背叛
若这个时候乙也是这么想的呢?那么结果就会是两人都选择背叛,两位囚犯一起判5年
而这,正是警方想要得到的结果。
不过,我要讲的故事,并不是上面这个,说这么多只是想让你能看懂而已,
ISLAND
我要讲的,是游戏《ISLAND》中冬篇的一个片段
人物介绍
- 哥哥 Setsuna
- 妹妹 Rinne
- 外公 (叫啥忘了
背景
他们生活在一个叫“ISLAND”的地方,是在地球进入冰河时期,人类向底下挖掘出的一个空间。。。(以下略)
在这里,食物是非常短缺的,在某一天的早上,家里就只有3个面包了,3个面包里面还有1个是坏的。
在这个时候,他们为了争夺面包,而进行了一场“比赛”
规则
以 石头剪刀布 的形式,赢的人平分2个好的面包,输的人获得一个坏的面包,如果赢的人是1个,那就一个人获得2个好的面包,输的人平分一个坏的面包
为了一次性决出胜负,外公再追加一条规矩,如果是平局,出石头的获得1个坏的面包,出布的没有面包,出剪刀的获得2个好的面包,并且外公说他要出石头,两兄妹不能和他出一样的。
解
我们来扮演哥哥,与妹妹一起和外公争夺面包,我们来定:
- 一人出剪刀,一人出布,因为是平局,触发追加规矩,剪刀获得2个面包,石头获得1个坏的面包,布没有面包,所以 出剪刀的得5分,出布得0分;
- 两人都出布,触发默认规矩,赢的兄妹平分2个好的面包,输的外公获得1个坏的面包,两人各得3分;
- 两人都出剪刀,触发默认规则,赢的外公获得2个好的面包,输的兄妹平分一个坏的面包,记2人各得1分。
矩阵表格就是:
哥哥(布) | 哥哥(剪刀) | |
---|---|---|
妹妹(布) | 3,3 | 0,5 |
妹妹(剪刀) | 5,0 | 1,1 |
所以,
和前面说的的囚徒困境一样,最优解是两人都出布来合作,能使2人的收益最大化。
实际结果
因为哥哥对妹妹的绝对信任,于是,哥哥出了布,但最后妹妹出了剪刀。
两人一起出门后,哥哥问妹妹,"我明明那么信任你,为什么你还是背叛我出了剪刀?"。
妹妹平静的回答到:我看到了外公的腿受伤了,虽然他特意掩盖了,但我还是发现了,我想把两个好的面包让给外公,如果直接将面包给他的话,以他的脾气肯定不会接受的,于是想故意输掉把面包让给外公,我还以为哥哥发现了呢,真失望
。
后记
囚徒困境,我们是站在囚犯的角度来想问题的解决方法的,但有没有想过警方的感受?
两个囚犯是因为证据不足,才使用这个方法的,但囚犯就这样关押半年后释放,这样对警方来说,非常的头疼。
妹妹看出了“囚徒困境”后面的另一层意思:
运气是平等的,有人获得了好运,那就会有人倒霉,对囚犯来说是好的结果,对警方来说就是坏的结果
世上没有绝对的好坏,好结果都是建立在他人的基础上,