《博弈论》:“囚徒困境”是与他人博弈时实现利益最大化的缩影

前情回顾:《博弈论》:想要在博弈中取得胜利,最好办法是假设对方是野蛮的

1、囚徒困境

“囚徒困境”是1950年美国兰德公司的梅里尔·弗勒德和梅尔文·德雷希尔拟定出的一个理论,它讲述的是:两个嫌疑犯在作案后被警察分别关押,他们彼此之间都不能互相通信,警察给他们两个选择,要么承认犯罪,要么抵赖。

但这两个嫌疑犯的选择会关乎到他们判刑多长时间,我们姑且将这两个嫌疑犯命名为甲和乙。

1)甲乙都承认,双方判刑8年;

2)甲乙都抵赖,双方判刑1年;

3)某一方承认,另一方抵赖,那么承认犯罪的一方将被释放,抵赖的一方将判刑10年。

对于任何一方来说,他们获刑的结果都可能是0、1 、8、10年中的一种。

从整体来看,双方都抵赖的情况下,虽然被判刑1年,却实现了整体的利益最大化。

但从个人来看,如果承认犯罪,那么会被释放或者判刑8年。而如果抵赖,则会被判刑1年或10年。

而由于甲乙之间是不能相互通信的,那么这就是一个在未知信息下与对方博弈的一个过程。在囚徒困境中,囚徒考虑的都是自身利益的最大化,于是彼此都选择了承认犯罪,判刑8年。

2.生活中的囚途困境

囚徒其实也发生在我们周围,就比如说很多家长给孩子报班,每个家长都在猜测其他家长的想法,看到其他家长去报班了,于是也给自己的孩子报班。

两家的孩子都报班了,那么大家的孩子都不相上下,可是却把孩子给累倒了。

但如果大家都约好,我们不去报班了,这显然能够实现整体利益的最大化,孩子与同伴不会相差很多,还能快乐地玩耍。

大家约好都不去报班,看起来好像双输,却能够实现整体利益的最大化。

此外,在价格竞争、环境保护和社交问题等方面都存在囚徒困境。就以价格竞争为例,价格竞争可以分为商家与消费者的博弈,以及商家与商家的博弈。

在商家与消费者的博弈中,如果商家不让利,就吸引不了消费者。于是商家在与消费者博弈的过程中找到了一个平衡点,就是通过让利促使消费者消费,就如我们常听到的:满300减30,买二送一,两件9折,三件85折……

在商家与商家的博弈中,如果大家都打起价格战,那么彼此可能都没有利益可图,而最大的受益人就是消费者,那最好的办法就是在这个博弈的过程中找到一个平衡点,大家约定商品的价格区间,如果远高于这个价格区间,消费者就不会下单,如果低于这个价格区间,商家就会被拉出群聊,这对大家都没有好处。

3.优秀的策略是建立在别人成功的基础上的

阿克塞尔罗德是行为分析及博弈论专家,他曾邀请一群人来参加博弈游戏,规则是:

我们用Y代表合作,用N代表不合作,并设定以下规则:若A和B都选择Y,两人都得3分;若A和B都选择N,两人都得1分;若一人选Y,另一人选N,选Y的人得0分,选N的人得5分。

对于个人来说,在一次博弈中想要取得个人利益最大化,那就必须把5分拿下,选择N,此时的团体总分是0+5=5分,但这个5分并不是每局都能稳定获得的,因为如果对方也选了N,那这局就只能获得1分。

可对于团体来说,如果要实现整体利益最大化,就得双方进行合作,此时的团体总分是3+3=6分,并且能够保证在每局中双方都能稳定获得3分。

阿克塞尔罗德让每一个参加游戏的人把自己认为得分最高的策略编成计算机程序,然后让这些程序两两博弈循环进行下去,最终“一报还一报”的程序获得了最高分。

这个程序的特点在于:第一次对局的时候采取合作策略,之后每次对局都以对手上一次的策略作为参考,即对手上一次选择合作,我这一次就选择合作,而如果对手上一次选择不合作,那我这一次也不合作。在双方程序博弈的过程中,另一方会发现这个规律,并采取合作的策略,因为这是在当前情况下的最优解。

在所有程序博弈结束后,阿克塞尔罗德发现得分排名靠前的程序一般有三个特点:

1)具备善良性:即从来不主动背叛别人;

2)具备可激怒性:当对方背叛你时,你也要给予报复。

3)宽容性:别人背叛了你一次,你不能无休止地报复,而要在别人选择合作的时候与其合作。

其实这个程序的特点也告诉我们:优秀的策略是建立在别人成功的基础上的。如果我们想要获取利益,不能只考虑自身,而要选择与他人合作,实现彼此的共赢。

4、结语

双方在博弈的时候,彼此都在猜测对方的策略:一方为了战胜对手,他可能会仔细考虑另一方的想法,而另一方也会如此考虑,同时一方还可能考虑另一方在想他的想法,而另一方也可能知道对手想到了他的想法。

那么想要在博弈中找到一个最优解,最好的方法就是选择合作,实现双赢。

@西西里太阳:《博弈论》的讲解一共有5期,关注我,看更多解读!

(0)

相关推荐

  • 保持善良,运气绝不会差!

    人在职场,身不由己. 这句话道尽了很多人的无奈.彷徨.挣扎和困惑. 人生何处不是局?职场也是一个局,一个金字塔形的局:大多数人在最底层,极少数人在中间,尖上更是寥若晨星. 现实是残酷的,不争取就可能永 ...

  • 20分钟带你学会博弈论

    20分钟带你学会博弈论 2021-06-25 19:50·LeviT 博弈论 博弈论入门 什么是博弈论 博弈论是指双方或多方在竞争.合作.冲突等情况下,充分了解各方信息,并以此选择一种能为本方争取最大 ...

  • 博弈论中社会困境的四种形式

    最近在看凯文··凯利的<失控>,相信不少朋友都读过或听过这本大作,书中第5章第5节提到了博弈论衍生出的"社会困境"分为四种变体,分别是"草鸡博弈". ...

  • 6.3囚徒困境的破解——重复博弈|20几岁必须要知道的经济学常识|20几岁必须要知道的经济学常识章节...

    不再有买卖机会的时候,特点是尽量谋取暴利并且带欺骗性,比如车站.码头.旅游景点的东西往往质次价高,其原因就在于买卖双方很少有'重复博弈'的机会. 经济学家罗伯特·阿克塞尔洛德设计了一个重复博弈的计算机 ...

  • 博弈论 | 囚徒困境

     Prisoners' Dilemma  囚徒困境是博弈论的非零和博弈中最具代表性的例子,反映个人最佳选择并非团体最佳选择.虽然困境本身只属模型性质,但现实中的价格竞争.环境保护等方面,也会频繁出现类 ...

  • 理赔时如何利益最大化,你应该掌握的4个方法

    陆拾肆/文 嗨,我是陆拾肆,带你买对保险不买贵. 今天想和大家聊聊我们T博士作为独立经纪人团队,平时可以为投保人争取权益的4个办法. 看完这篇,你会对保险相关法律法规更了解,理赔时使自己的权益最大化, ...

  • 炒股的囚徒困境:韭菜的博弈论,想在股市赚钱,先要博弈人性

    囚徒困境可能是行为金融学中最为大众熟知的理论,在现实中出现的频率也很高,所以这个"基本面分析与行为金融学结合"的新系列,就以"囚徒困境"为开篇.为防止有读者还不 ...

  • 数学思维 | 博弈论经典案例分析—囚徒困境

    数学思维 | 博弈论经典案例分析—囚徒困境

  • 漫画:博弈论系列 之 囚徒困境

    本系列将为大家带来一整套的博弈论问题.因为在面试的过程中,除了常规的算法题目,我们经常也会被问到一些趣味题型来考察思维,而这类问题中,很多都有博弈论的影子存在.这些公司里以FLAG(Facebook, ...

  • 博弈论入门——囚徒困境

    概念引入 博弈论,又称为对策论(Game Theory).赛局理论等,既是现代数学的一个新分支,也是运筹学的一个重要学科. 博弈的思想自古就有,下棋.战争的决胜负过程都可以包含博弈的过程,开始的博弈往 ...

  • 博弈与心理·北宋时期的囚徒困境

    钱藻(1022~1082年),字醇老,苏州人.钱藻家世显赫,他父亲是北宋翰林学士钱明逸,钱藻在家是第二个儿子:钱藻的玄祖就是曾经的吴越王钱元瓘.钱藻在朝为官,一直做到翰林侍读学士,死后被朝廷封赠为太中 ...

  • 囚徒困境:想赚别人的钱,先来博弈人性

    人神共奋 将"基本面和行为金融学结合起来" 本文来自微信公众号"思想钢印"(ID:sxgy9999),作者:人神共奋,36氪经授权发布. "基本面和行 ...