改变世界的博弈论和我们有什么关系?
改变世界的博弈论和我们有什么关系? | 日课原创 张磊 新校长传媒 2017-05-23
今日叙事2015年5月23日,美国数学家约翰·纳什(John Nash Jr.)和妻子遭遇车祸,不幸逝世。1950年,纳什在论文中提出一个重要概念(之后被称为“纳什均衡”),成为博弈论中的一项重要突破。如今,“纳什均衡”早已广泛运用在经济学、计算机科学、演化生物学、人工智能、会计学、政策和军事理论等方面。纳什也因此于1994年与其他两位博弈论学家共同获得诺贝尔经济学奖。今天,我们就来谈谈为世界带来深远影响的博弈论。改变世界的博弈论和我们有什么关系?文 / 张磊(蒲公英教育智库研究员)人类,是追求利益的动物。当人与人出现交集的时候,难免会产生利益冲突。当双方都想达成某种目的的时候,肯定会受到彼此的影响,这种情境就是“博弈”。这个时候,“博弈心理学”或者说“博弈论”就能派上用场了。相信很多人都听过“囚徒困境”一词——两个犯罪嫌疑人隔离审讯,他们都做出利于自身的事,最后却导致对双方都不利的结果——它形容的就是博弈论的一种经典情况。博弈论是一门怎样的学问?那么,博弈论到底是什么?学界的定义是,“在某种特定的条件下,相互影响的多个主体之间所产生的战略性的相互关系”,“在这种相互依存的情况下,为了合理地确定行为模式和分配方法而进行思考的数学理论”。相信即使反复看了几遍,很多读者仍然会一头雾水。所以我们简化了一下,博弈论就是“推测对手的行动,在此基础上合理地确定对自己最有利的战略”。这时,对手和我们一样,也想“获得最大的利益”,因此, “博弈论”往往能在双方的相互影响中,帮我们找到一种最合适的选择。我们所生活的社会,就是人与人之间、企业与企业之间,在遵守一定规则的前提下,为了达成各自的目的而进行的竞争(有时也有合作)。可以说,人生处处都有博弈。博弈论的核心:纳什均衡博弈论思想可以追溯到18世纪,但主要的理论发展开始于20世纪20年代。1944年冯·诺依曼和奥斯卡·摩根斯坦出版的《博弈论和经济行为》一书,被公认是博弈论诞生的标志。1951年,约翰·纳什提出“纳什均衡”成为博弈论的重大突破,这才让博弈论引起关注,并开始运用到经济学、社会行为学等多个领域。“纳什均衡”可以理解为约翰·纳什给博弈提出的一种解法,甚至可看作博弈论的核心。用一句话形容“纳什均衡”,就是:指博弈的局中人都对自己选择的策略感到满意,对于得到的结果也不会后悔的一种选择。下面,我们用博弈论中最经典的状况之一——囚徒困境来详细地解释一下。事情是这样:参与某个案件的两位犯罪嫌疑人A、B一起被警方抓获了。由于警方还没有掌握两人犯罪的确凿证据,如果A和B始终保持沉默,将因为证据不足无法起诉。于是警方就想了个办法:将A和B分开关押,并对他们说相同的一番话:1. 如果你坦白交代,而你同伴保持沉默的话,可以算你戴罪立功,立即释放,你同伴就判有期徒刑4年;2. 如果你们两人互相揭发对方,证据齐全,各判有期徒刑2年;3. 如果你们两人始终保持沉默,我们没有证据,只能扣留你们2天。嫌疑人A、B利益关系更直观的图表如下:囚徒困境嫌疑人B沉默坦白嫌疑人A沉默2天(A)2天(B)4年(A)0天(B)坦白0天(A)4年(B)2年(A)2年(B)我们尝试用博弈论来分析一下。首先,寻找A的最佳策略。当B选择“沉默”,A选择“坦白”的结果最佳(沉默关2天;坦白关0天);如果B选择“坦白”的话,A同样只有选择“坦白”的结果最佳(沉默关4年;坦白关2年)。因此,对于A来说,无论如何,选择“坦白”的结果都好过“沉默”。同样的,B的最佳策略也会是“坦白”。因此,对于A、B两人都是“坦白”的结果好于“沉默”。两人的最佳策略,就是“坦白”对“坦白”(上表中右下角淡蓝色表格),双方都将被判2年有期徒刑。而这种策略组合,就是上述案例中的“纳什均衡”。但是,有读者可能觉得有问题,上面表格中最佳策略明明是“A、B两人都保持沉默”(上表中浅灰色表格)才对啊?的确,如果A、B两人是被关进同一间审讯室,双方有可能找机会用眼神交流,达成“都别招供”的默契,从而都选择“沉默”。但是,无论上例还是真实情况中,警察都会采取单独审讯以防串供。这样一来,在嫌疑人无从知晓同伙会“沉默”还是“坦白”的情况下,往往只能根据“坦白对那家伙更有利,他一定会供出我的,我还是坦白好了”的推测。最终,双方都会选择对自己而言最佳的策略,即“坦白”从宽。
只不过,这样的“最佳”策略反而会导致双方得不到真正“最佳”的结果。看到这里,有没有想起刑侦剧里常出现的那句“你的同伙刚刚已经招供,我劝你也赶紧坦白吧”台词?生活中的博弈论 类似“囚徒困境”的博弈类型,在现实生活中经常能够见到。比如,企业之间的价格竞争。价格战中,企业“不降价”相当于上例中的“沉默”,“降价”相当于“坦白”。在博弈过程中,互相竞争的企业就容易陷入竞相降价的囚徒困境中。再如,国家与国家之间的军备竞赛也可以视作囚徒困境,“削减军备”相当于“沉默”,“扩充军备”相当于“坦白”。结果,竞争国之间就陷入了无穷无尽的军备扩充竞赛。除了囚徒困境,博弈论中还有很多有趣的讨论。前不久《速度与激情8》上映,票房火爆,这类电影里经常出现的“双方迎头飙车互不相让,最后一刻总有人先认怂错开”场景,就是博弈论中所讨论的“胆小鬼博弈”。
赢得这种博弈的方法也很有趣,本来双方有“加速”和“转向”两个选项,但如果其中一方主动放弃“转向”的选项,并且让对方看到——比如让其他人把自己绑住,无法动弹。为了避免最大的损失,对方的唯一理性的选择,就只剩下“转向了”。
博弈论本身其实是一门及其复杂的学问,需要用数学建立各种不同的模型,还要结合社会学、经济学、心理学等各方面的知识。刚刚我们只是用了一些比较简单、有趣的案例找到这门学问一个小的切入点作了介绍。如果还有不太清晰的地方,不如再看看下面这则科普小短片:《科普:博弈论是什么?》▼博弈论是从20世纪50年度以来改变了科学界、经济学界的重大理论。不敢妄谈用短短2000多字篇幅就将它完整、清晰地呈现在读者面前。但如果今天的日课能引起你对它额外的兴趣,那会是小新君莫大的荣幸。最后,下面这些情境中,博弈论也能派上用场,你知道吗?感兴趣的话,不妨留言谈谈你的想法。1. 有些老师为什么会自愿义务加班?2. 让领导认同自己思路、方法的技巧3. 让对方难以回绝的交涉方法4. 家校纠纷逐渐恶化升级的原因,以及应对策略5. 主动要求承担更多工作好处多,还是等领导安排工作更占便宜?“教育日课”征稿邮箱:2594889720@qq.com尊重原创,支持好文喜欢本文,可识别下列二维码向作者打赏 ▼▼作者 | 张磊图 | 《科普:博弈论是什么?》视频截图责编 | 赵方“新校长传媒”广告合作请联系 023-67450968推荐阅读点击关键词,阅读更多“日课”相关内容创建学校气象 | 家庭实验室 | 今天谈谈数学教育更要打假 | 计划生育这一代 | 历史相对论今天的德育 | 挑战式学习 | 最美女先生养育参考书 | 如果教育是诗 |惊蛰:自然教育天才少年的前世今生 | 最可爱的人 |语言学习意义/ 2017年《新校长》杂志 /点击下图,马上订购 ▼