囚徒困境
百科名片
编辑本段概念释义
编辑本段概念来源
单次多重
主旨
编辑本段固定困境
编辑本段经典困境
例子
甲沉默
|
甲背叛
| |
乙沉默
|
二人同服刑1年
|
乙服刑10年,甲即时获释
|
乙背叛
|
甲服刑10年,乙即时获释
|
二人同服刑8年
|
解说
编辑本段一般形式
一般形式囚徒困境的
支付矩阵
|
以“T、R、P、S”符号表示
|
以“胜-负”术语表示
|
一般形式囚徒困境的
支付矩阵
|
以“T、R、P、S”符号表示
|
以“胜-负”术语表示
| ||||||
合作
|
背叛
|
合作
|
背叛
|
合作
|
背叛
| |||
合作
|
3, 3
|
0, 5
|
合作
|
R, R
|
S, T
|
合作
|
胜-胜
|
大负-大胜
|
背叛
|
5, 0
|
1, 1
|
背叛
|
T, S
|
P, P
|
背叛
|
大胜-大负
|
负-负
|
T、R、P、S符号表
| ||||
符号
|
分数
|
英文
|
中文(非术语)
|
解释
|
T
|
5
|
Temptation
|
背叛诱惑
|
单独背叛成功所得。
|
R
|
3
|
Reward
|
合作报酬
|
共同合作所得
|
P
|
1
|
Punishment
|
背叛惩罚
|
共同背叛所得
|
S
|
0
|
Suckers
|
受骗支付
|
被单独背叛所获
|
编辑本段
为什么Kitty的邻居没有一个人援助她?人们普遍归因于人的异化与冷漠。但心理学家有不同的看法,大量的实验和研究显示在公共场所观看危机事件的旁观者越多,愿意提供帮助的人就越少,这被称为旁观者效应。
为什么会这样呢?心理学家
下面用经济学中的纳什均衡[2]的方法定量地说明,在人数变多时,的确是任何一个人提供帮助的可能性变小,而且存在某人提供帮助的可能性也在变小!通俗的说,在开头的报警案例中,围观者(邻居)越多,报警的可能性越小! (这些来源于2年前与同学的讨论,只不过当时还不知道心理学上也有对应的分析。)
在这里假设人都是利益动物(也就说下面的分析不考虑社会心理学中提到的人的心理因素)。在最开始的抢劫案件中,假设有
个围观者,有人提供帮助(报警),每个人都能得到
的固定收益,但报警者会有额外损失
(可以看成提供帮助所消耗的时间,精力或者报警者所可能遇到的危险——注意最近的彭宇案件)。容易知道,在
时,一个完全理性的人不可能去报警,所以我们只考虑
的情形。我们来分析一下,在这个模型里面,每个人将如何行动?
按照上面的假定,对于某个人A而言,他的收益矩阵为:
其他n-1个人不报警 其他n-1个人有人报警 A不报警 0 
A报警 

我们求上面的收益矩阵的纳什均衡,由于每个人都是对称的(暂且只考虑对称的纳什均衡),无妨假设每个人不报警的概率为
,不难得到纳什均衡在
达到。注意
是随着人数
增大而增大的!更重要的是,存在某人报警的概率
随着人数的增加而减少!
注意,上面的结果也提供了报警的概率与
的相关关系。
(注:纳什均衡点计算可能有点问题,有网友指出应该是p=pow(b/na, 1/(n-1)),不过不影响结果分析。)
更多推断:
- 相对而言,城市居民比小乡村居民更冷漠:在人少的地方获得帮助的可能性反而更大。
- 朋友并不是越多越好的(?)
- 求助时不要同时向若干人求助,即便如此也不要让他们互相知道。
- 常在新闻里看到,一人受伤或者...,多少多少人围观,却没有人提供帮助。但从上面的分析可以看出,更多人看热闹并不代表着社会道德水平更低。
- 一个社会的道德水平,如不考虑别的因素(社会和心理上的),将由
和
的比值决定,而在受益
确定的情况下,完全由
决定,这里的
是提供帮助的成本(包括时间,精力,以及有可能遭致的打击报复,甚至忘恩负义者的反咬)。 - 和谐社会,需要努力降低前面的
值,通过给与金钱上或者精神上的奖励。 - 彭宇事件,根据网络上的反应,这件事情大大提高了
,将导致道德水平下降。[西乔有一篇文章老太摔倒均衡点给出了类似的分析]
参考:
[1] David G. Myers, Social Psychology - 社会心理学, P363-369.
[2] 纳什均衡, 简单说来,纳什均衡是指相互作用的经济主体,每一方都在另一方所选择的战略为既定时,选择自己的最优战略。一旦双方达到了这种纳什均衡,都不会再有做出不同决策的冲动或激励。其最重要的案例是囚徒困境。
现实例子
为什么Kitty的邻居没有一个人援助她?人们普遍归因于人的异化与冷漠。但心理学家有不同的看法,大量的实验和研究显示在公共场所观看危机事件的旁观者越多,愿意提供帮助的人就越少,这被称为旁观者效应。
为什么会这样呢?心理学家
下面用经济学中的纳什均衡[2]的方法定量地说明,在人数变多时,的确是任何一个人提供帮助的可能性变小,而且存在某人提供帮助的可能性也在变小!通俗的说,在开头的报警案例中,围观者(邻居)越多,报警的可能性越小! (这些来源于2年前与同学的讨论,只不过当时还不知道心理学上也有对应的分析。)
在这里假设人都是利益动物(也就说下面的分析不考虑社会心理学中提到的人的心理因素)。在最开始的抢劫案件中,假设有个围观者,有人提供帮助(报警),每个人都能得到
的固定收益,但报警者会有额外损失
(可以看成提供帮助所消耗的时间,精力或者报警者所可能遇到的危险——注意最近的彭宇案件)。容易知道,在
时,一个完全理性的人不可能去报警,所以我们只考虑
的情形。我们来分析一下,在这个模型里面,每个人将如何行动?
按照上面的假定,对于某个人A而言,他的收益矩阵为:
| 其他n-1个人不报警 | 其他n-1个人有人报警 |
A不报警 | 0 | ![]() |
A报警 | ![]() | ![]() |
我们求上面的收益矩阵的纳什均衡,由于每个人都是对称的(暂且只考虑对称的纳什均衡),无妨假设每个人不报警的概率为,不难得到纳什均衡在
达到。注意
是随着人数
增大而增大的!更重要的是,存在某人报警的概率
随着人数的增加而减少!
注意,上面的结果也提供了报警的概率与的相关关系。
(注:纳什均衡点计算可能有点问题,有网友指出应该是p=pow(b/na, 1/(n-1)),不过不影响结果分析。)
更多推断:
- 相对而言,城市居民比小乡村居民更冷漠:在人少的地方获得帮助的可能性反而更大。
- 朋友并不是越多越好的(?)
- 求助时不要同时向若干人求助,即便如此也不要让他们互相知道。
- 常在新闻里看到,一人受伤或者...,多少多少人围观,却没有人提供帮助。但从上面的分析可以看出,更多人看热闹并不代表着社会道德水平更低。
- 一个社会的道德水平,如不考虑别的因素(社会和心理上的),将由
和
的比值决定,而在受益
确定的情况下,完全由
决定,这里的
是提供帮助的成本(包括时间,精力,以及有可能遭致的打击报复,甚至忘恩负义者的反咬)。
- 和谐社会,需要努力降低前面的
值,通过给与金钱上或者精神上的奖励。
- 彭宇事件,根据网络上的反应,这件事情大大提高了
,将导致道德水平下降。[西乔有一篇文章老太摔倒均衡点给出了类似的分析]
[1] David G. Myers, Social Psychology - 社会心理学, P363-369.
[2] 纳什均衡, 简单说来,纳什均衡是指相互作用的经济主体,每一方都在另一方所选择的战略为既定时,选择自己的最优战略。一旦双方达到了这种纳什均衡,都不会再有做出不同决策的冲动或激励。其最重要的案例是囚徒困境。