博弈论(二)囚徒困境

过去的,未来的
2020-01-08 / 2 评论 / 0 点赞 / 706 阅读 / 0 字 / 正在检测是否收录...
温馨提示:
本文最后更新于 2020-01-08,若内容或图片失效,请留言反馈。部分素材来自网络,若不小心影响到您的利益,请联系我们删除。

案例:一个案子的两个嫌疑犯被分开审讯,警官分别告诉两个囚犯,如果你招供,而对方不招供,则你将被立即释放,而对方将被判刑十年;如果两人均招供,将均被判刑两年。如果两人均不招供,将最有利,只被判刑半年。于是,两人同时陷入招供还是不招供的两难处境。 20161025135318_m

分析:
A供认A拒认
B供认A 2年,B 2年B释放,A 10年
B拒认A释放,B 10年A 0.5年 B 0.5年

显然最好的策略是双方都抵赖,结果是大家都只被判半年。

然而由于两人处于隔离的情况下无法串供,每一个人都只能从对自己最有利的前提出发,选择了坦白。这样,原本对双方都有利的策略(抵赖)和结局(被判半年刑)就不会出现。这种两人都选择坦白的策略以及因此被判2年的结局被称为“纳什均衡”,也叫非合作均衡。在“纳什均衡”中,每一方在选择策略时都没有“共谋”,他们只是选择对自己最有利的策略,而不考虑共同合作或任何其他对手的利益。也就是说,这种策略组合由所有局中人(也称当事人、参与者)的最佳策略组合构成,但实施这样的策略的结局也是对所有人都不利的结局。

总结:

我们不难发现,当每个人追求自己的最大利益时,社会和团体不一定会达到它的最大利益,这种情况在现实中有很多相似的例子。

数学家约翰·冯诺依曼曾说过:“在一个存在着相互作用的博弈中,最好的策略直接取决于对方采用的策略,特别是取决于这个策略为发展双方合作留出多大的余地。”

0

评论区