Skip to content

囚徒困境

前言

囚徒困境大家都知道吗?

警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人有罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:

  • 若一人认罪并作证检控对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
  • 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
  • 若二人都互相检举(互相“背叛”),则二人同样判监5年。

表格解释如下

乙沉默(合作)乙认罪(背叛)
甲沉默(合作)二人同服刑半年甲服刑10年;乙即时获释
甲认罪(背叛)甲即时获释;乙服刑10年二人同服刑5年

我们定

  • 一人背叛、一人合作:背叛者得5分(背叛诱惑),合作者0分(受骗支付)。
  • 二人都合作:各得3分(合作报酬)。
  • 二人都背叛:各得1分(背叛惩罚)。

那么矩阵表格就是:

甲(合作)甲(背叛)
乙(合作)3,30,5
乙(背叛)5,01,1

若以T(Temptation)=背叛诱惑,R(Reward)=合作报酬,P(Punishment)=背叛惩罚,S(Suckers)=受骗支付,以个人选择得分而言,可得出以下不等式。

T>R>P>S

(解:从5>3>1>0获得以上不等式)

若以整体获分而言,将得出以下不等式。

2R>T+S或2R>2P

(解:2×3>5+0或2×3>2x1;合作2人共得6分,比起互相背叛的共得2分及单独背叛的共得5分,显然合作获分比背叛高。合作在团体而言是支配性策略。)

而重复博弈或重复的囚徒困境将会使参与者从注重T>R>P>S转变成注重2R>T+S。就是说将使参与者脱离困境。
(以上理论是道格拉斯·霍夫施塔特创建的。)

理想解

从上面的解可以看出,两人在合作的时候,获得的分数是最高的(合作2人共得6分)
这样才是收益最大化的最优解。

实际结果

但是呢,人,是一种自私的生物,如果只顾自己的收益最大化,应该会这么选呢?

虽然合作两人共得6分,但每人只有3分
若是背叛对方,就有可能获得5分
那么有没有办法让自己利益最大化的概率提高呢?
有的,那就是利用对方的信任,最开始和对方商量好,只要都合作,就可以利益最大化
然后在实际进行的时候,因为相信对方一定会选则合作,这个时候选择背叛,就能将自己的收益从3提高到5

如果这个时候对方也是这么想的呢?那么结果就会是两人都选择背叛,两位囚犯一起判5年


如果两人一开始就没考虑过会自己会遇到这种问题,从一开始没有商量过这么办,会出现什么结果呢?

虽然说理想解是两人都选择合作
如果甲选择合作,那么甲的最低收益是0,最高收益是3
如果甲选择背叛,那么甲的最低收益是1,最高收益是5 只顾自己的情况下,甲是会选中背叛

若这个时候乙也是这么想的呢?那么结果就会是两人都选择背叛,两位囚犯一起判5年


而这,正是警方想要得到的结果。

不过,我要讲的故事,并不是上面这个,说这么多只是想让你能看懂而已,

ISLAND

我要讲的,是游戏《ISLAND》中冬篇的一个片段

人物介绍

  • 哥哥 Setsuna
  • 妹妹 Rinne
  • 外公 (叫啥忘了

背景

他们生活在一个叫“ISLAND”的地方,是在地球进入冰河时期,人类向底下挖掘出的一个空间。。。(以下略)

在这里,食物是非常短缺的,在某一天的早上,家里就只有3个面包了,3个面包里面还有1个是坏的。

在这个时候,他们为了争夺面包,而进行了一场“比赛”

规则

以 石头剪刀布 的形式,赢的人平分2个好的面包,输的人获得一个坏的面包,如果赢的人是1个,那就一个人获得2个好的面包,输的人平分一个坏的面包
为了一次性决出胜负,外公再追加一条规矩,如果是平局,出石头的获得1个坏的面包,出的没有面包,出剪刀的获得2个好的面包,并且外公说他要出石头,两兄妹不能和他出一样的。

我们来扮演哥哥,与妹妹一起和外公争夺面包,我们来定:

  • 一人出剪刀,一人出布,因为是平局,触发追加规矩,剪刀获得2个面包,石头获得1个坏的面包,布没有面包,所以 出剪刀的得5分,出布得0分;
  • 两人都出布,触发默认规矩,赢的兄妹平分2个好的面包,输的外公获得1个坏的面包,两人各得3分;
  • 两人都出剪刀,触发默认规则,赢的外公获得2个好的面包,输的兄妹平分一个坏的面包,记2人各得1分。

矩阵表格就是:

哥哥(布)哥哥(剪刀)
妹妹(布)3,30,5
妹妹(剪刀)5,01,1

所以,

和前面说的的囚徒困境一样,最优解是两人都出来合作,能使2人的收益最大化。

实际结果

因为哥哥对妹妹的绝对信任,于是,哥哥出了布,但最后妹妹出了剪刀
两人一起出门后,哥哥问妹妹,"我明明那么信任你,为什么你还是背叛我出了剪刀?"。
妹妹平静的回答到:我看到了外公的腿受伤了,虽然他特意掩盖了,但我还是发现了,我想把两个好的面包让给外公,如果直接将面包给他的话,以他的脾气肯定不会接受的,于是想故意输掉把面包让给外公,我还以为哥哥发现了呢,真失望

后记

囚徒困境,我们是站在囚犯的角度来想问题的解决方法的,但有没有想过警方的感受?
两个囚犯是因为证据不足,才使用这个方法的,但囚犯就这样关押半年后释放,这样对警方来说,非常的头疼。
妹妹看出了“囚徒困境”后面的另一层意思:

运气是平等的,有人获得了好运,那就会有人倒霉,对囚犯来说是好的结果,对警方来说就是坏的结果
世上没有绝对的好坏,好结果都是建立在他人的基础上,