人的直觉判断能力真的靠谱吗？公式算出的答案是......

2024-05-13 23:23:37

本文授权转载自原点阅读（ID：duhaoshu）

微信公众号

如今，“概率”一词在我们的生活中随处可见，被人们使用得越来越广泛和频繁。

因为这是一个越来越多变的世界: 一切都在变化，一切都难以确定。我们的世界可以说是由变量构成的，其中包括很多决定性变量。

比如新闻说: “北京时间2016年11月3日20时43分，长征五号在海南文昌成功发射”，这里的时间、地点都是确定的决定性变量。

然而，我们的生活中也有许多难以确定的随机变量，比如明天雾霾的程度，或某公司的股票值，等等，都是不确定的随机变量。随机变量不是用固定的数值表达，而是用某个数值出现的概率来描述。正因为处处都有随机变量，所以处处都听见“概率”一词。

你打开电视听天气预报，看看今天会不会下雨，气象预报员告诉你说: 今天早上8点钟的“降水概率”是90%；你满怀期望地买了50张彩票，朋友却告诉你，不要白花这50块钱，因为你中奖的概率只有一亿分之一；你手臂上长了一个“肉瘤”，医生初步检查后安慰你，这块东西是恶性瘤的概率只万分之三而已……

生活中“概率”这个词太常见了，以至于人们不细想也大概知道是个什么意思，比如说，最后一个例子中，0.03%的恶性概率的意思不就是说，“10000个这样的肉瘤中，只有3个才会是恶性的”吗？因此，在经典意义上，概率就可以被粗糙地定义为事件发生的频率，即发生次数与总次数的比值。更准确地说，是总次数趋于无限时，这个比值趋近的极限。

虽然“概率”的定义不难懂，好像人人都会用，但你可能不知道，概率计算的结果经常违背我们的直觉，概率论中有许多难以解释、似是而非的悖论。

我们的思维过程中也有盲点，需要通过计算和思考来澄清。概率论是一个经常出现与直觉相悖的奇怪结论的领域，连数学家也是稍有不慎便会错得一塌糊涂。

我们就举例说明经典概率中的一个悖论，叫作“基本比率谬误(base rate fallacy)”。

从一个生活中的例子开始。王宏去医院做化验，检查他患上某种疾病的可能性。其结果居然为阳性，他赶忙在网上查询。

网上的资料说，检查总是有误差的，这种检查有“1%的假阳性率和1%的假阴性率”。这句话的意思是说，在得病的人中做检查，有1%的人是假阴性，99％的人是真阳性。而在未得病的人中做检查，有1%的人是假阳性，99％的人是真阴性。于是，王宏估计他自己得了这种疾病的可能性为99%。王宏想，既然只有1%的假阳性率，99%都是真阳性，那我在人群中已被感染这种病的概率便应该是99%。

可是，医生却告诉他，他在普通人群中被感染的概率只有9%左右。这是怎么回事呢？王宏的思路误区在哪里？

医生说: “99%？哪有那么大的感染概率啊。99％是测试的准确性，不是你得病的概率。你忘了一件事: 被感染这种疾病的正常比例是不大的，1000个人中只有一个人患病。”

这位医生经常将概率方法用于医学上。他的计算方法基本上是这样的: 因为测试的误报率是1%，1000个人将有10个被报为“假阳性”，而根据这种病在人口中的比例(1/1000=0.1%)，真阳性只有1个，所以，大约11个测试为阳性的人中只有一个是真阳性的，因此，王宏被感染的概率大约是1/11，即9%。

王宏思来想去仍感到糊涂，但这件事激发了王宏去重温他之前学过的概率论。经过反复阅读，再思考琢磨医生的算法之后，他明白了自己犯了那种叫作“基本比率谬误”的错误，即忘记使用“这种病在人口中的基本比例(1/1000)”这个事实。

谈到基本比率谬误，我们最好是先从概率论中著名的贝叶斯定理说起。托马斯·贝叶斯(Thomas Bayes ，1701—1761)是英国统计学家。

托马斯·贝叶斯

贝叶斯定理是他对概率论和统计学做出的最大贡献，是当今人工智能中常用的机器学习的基础框架，它的思想之深刻远超一般人所能认知。

粗略地说，贝叶斯定理涉及两个随机变量A和B的相互影响，如果用一句话来概括，这个定理说的是: 利用B带来的新信息，应如何修改B不存在时A的“先验概率”P(A)，从而得到B存在时的“条件概率”P(A|B)，或称后验概率，如果写成公式:

这里先验、后验的定义是一种约定俗成，是相对的。比如说也可以将A、B反过来叙述，即如何从B的先验概率P(B)，得到B的“条件概率”P(B|A)，见图中虚线所指。

不要害怕公式，通过例子，我们就能慢慢理解它。例如，对前面王宏看病的例子，随机变量A表示“王宏得某种病”；随机变量B表示“王宏的检查结果”。先验概率P(A)指的是王宏在没有检查结果时得这种病的概率(即这种病在公众中的基本概率0.1%)；而条件概率(或后验概率)P(A|B)指的是王宏“检查结果为阳性”的条件下得这种病的概率(9%)。如何从基本概率修正到后验概率的？我们待会儿再解释。

贝叶斯定理是18世纪的产物，200来年用得好好的，却不想在20世纪70年代遇到了挑战，该挑战来自于丹尼尔·卡尼曼(Daniel Kahneman，1934—)和特维尔斯基(Tversky)提出的“基本比率谬误”。前者是以色列裔美国心理学家，2002年诺贝尔经济学奖得主。基本比率谬误并不是否定贝叶斯定理，而是探讨一个使人困惑的问题: 为什么人的直觉经常与贝叶斯公式的计算结果相违背？如同刚才的例子所示，人们在使用直觉的时候经常会忽略基础概率。

卡尼曼等人在他们的文章《思考，快与慢》中举了一个出租车的例子，来启发人们思考这个影响人们“决策”的原因。

我们不想在这里深谈基本比率谬误对“决策理论”的意义，只是借用此例来加深对贝叶斯公式的理解。

假如某城市有两种颜色的出租车: 蓝色和绿色(市场占有比例为15∶85)。一辆出租车夜间肇事后逃逸，但还好当时有一位目击证人，这位目击者认定肇事的出租车是蓝色的。但是，他“目击的可信度”如何呢？

公安人员在相同环境下对该目击者进行“蓝绿”测试得到: 80%的情况下识别正确，20%的情况不正确。也许有读者立刻就得出了结论: 肇事车是蓝色的概率应该是80%吧。如果你做此回答，便是犯了与上面例子中王宏同样的错误，忽略了先验概率，没有考虑在这个城市中“蓝绿”车的基本比例。

那么，肇事车是蓝色的(条件)概率到底应该是多少呢？贝叶斯公式能给出正确的答案。首先我们必须考虑蓝绿出租车的基本比例(15∶85)。

也就是说，在没有目击证人的情况下，肇事车是蓝色的概率只有15%，这是“A=蓝车肇事”的先验概率P(A)= 15%。现在，有了一位目击者，便改变了事件A出现的概率。目击者看到车是“蓝”色的。不过，他的目击能力也要打折扣，只有80%的准确率，即也是一个随机事件(记为B)。

我们的问题是求出在有该目击证人“看到蓝车”的条件下肇事车“真正是蓝色”的概率，即条件概率P(A|B)。后者应该大于先验概率15%，因为目击者看到“蓝车”。如何修正先验概率？需要计算P(B|A)和P(B)。

因为A=蓝车肇事、B=目击蓝色，所以P(B|A)是在“蓝车肇事”的条件下“目击蓝色”的概率，即P(B|A) ＝80％。最后还要算先验概率P(B)，它的计算麻烦一点。P(B)指的是目击证人看到一辆车为蓝色的概率，等于两种情况的概率相加: 一种是车为蓝，辨认也正确；另一种是车为绿，错看成蓝。所以:

从贝叶斯公式:

可以算出在有目击证人情况下肇事车辆是蓝色的概率为41%，同时也可求得肇事车辆是绿车的概率为59%。被修正后的“肇事车辆为蓝色”的条件概率41%大于先验概率15%很多，但是仍然小于肇事车为绿色的概率0.59。

回到对王宏测试某种病的例子，我们也不难得出正确的答案:

从概率到贝叶斯滤波（下）

数学语文吧语文是米饭,数学是菜谱! 123篇原创内容公众号从概率到贝叶斯滤波(上) 02 贝叶斯滤波 2.1 贝叶斯公式 2.1.1 二维离散型随机变量的贝叶斯公式对于二维离散型随机变量 ,由 ...
贝叶斯推断 1. 基本概率模型和贝叶斯定理

这里简单介绍三个概念,古典概型,频率学派,贝叶斯学派. 古典概型这个模型下,随机实验所有可能的结果是有限的,并且每个基本结果发生的概率是相同的比如:投掷一枚均匀硬币,结果只有两种(假设硬币没有立起 ...
频率学派与贝叶斯学派的区别

有人学了多年统计说不清楚频率学派与贝叶斯学派的区别,什么主观对客观啦,什么似然函数对后验概率啦,那些都是现象,不是本质.两者本质上的区别是:频率学派把未知参数看作普通变量,把样本看作随机变量:而贝 ...
数据分析过程中，发现数值缺失，怎么办？

按照数据缺失机制,数据分析过程中,我们可以将其分为以下几类: (1)完全随机缺失(MCAR):所缺失的数据发生的概率既与已观察到的数据无关,也与未观察到的数据无关. (2)随机缺失(MAR):假设缺失 ...
贝叶斯学派与频率学派有何不同？

要说贝叶斯和频率学派,那简直太有意思了.为什么这么说呢?因为两个学派的理解对于我来说真的是一场持久战.我是在学习机器学习的时候接触到的这两个学派,此前并不知道,当时就被深深吸引了,于是找了各种资料学习 ...
人的直觉判断有多不靠谱？用公式算算就会啪啪打脸！

原点阅读全国科普阅读推广联盟会员,清华大学出版社科普图书品牌,中国科普作家协会会员单位.致力于科学普及和科技文化类图书出版,传播科学知识.科学精神.科学方法和科学理念.为读者提供客观.理性.多维.优 ...
虫洞真的存在吗？科学家给出明确答案，人类有可能超越光速

打开凤凰新闻,查看更多高清图片我们的科学技术正在不断地提高,然而在太阳系中仍存在着很多我们无法探测的星系.不知从什么时候开始,人类的科技水平好像进入了瓶颈期.人类对太阳系中的很多星球,已经处于比较熟 ...
人真能预测生命极限？当代高道算出自己寿命，临终3句话无人参透

自古有言:"人的命,天注定".当大限将至之时,甭管你年轻还是年老,健康或是虚弱.只要阎王叫你三更死,定然不敢留人到五更.在对生死的敬畏中,古人崇拜图腾,加入宗教,希望通过信仰与苦修 ...
古籍记录了多起坠龙事件，难道龙真的存在这座寺庙给出了答案！

话说咱们华夏民族都称呼自己是龙的传人,龙这种传说中的生物到底是不是真的存在过呢?关于龙的传说从远古就有流传,其中最好解释的一种说法是,龙是我们中国人的祖先由九种生物拼凑而成,是一种图腾.一种民族的象征 ...
巨人族真的存在吗？山海经给出了答案

在1883年,当时由美国政府/军方领导的史密森学会(Smithsonian)向南查尔斯顿丘陵派遣了一批考古人员.根据官方报告,该团队发现了许多7到9英尺高的巨型骨骼.其中一些具有"压缩型或平 ...
爱吃肉的人和爱吃素的人，哪个更长寿？11国研究结果给出了答案

李阿姨10年前被查出高血脂之后,就再也没有吃过肉,成为了彻底的素食主义者.今年年初,她总是感到头晕眼花,浑身没有力气,爬几级楼梯就累得气喘吁吁的. 前几天,她上厕所的时候,一头栽倒在地上,晕过去了.李 ...
为何有的人60岁就走了，有的人90岁还很健康？3位老人说出了答案

导语每个人都想长寿,因为能活到长寿年纪的老人都觉得是一件很幸福的事情,不但能够见识多一点东西,还能够享受儿孙满堂的场景. 所以长寿对于对于老人来说真的是一件很幸福的事情,但是在现实生活中,并不是所有 ...
很多人对大字书法缺少一定的审美和判断能力，外行汉会说执笔错了

很多人对大字书法缺少一定的审美和判断能力，外行汉会说执笔错了
第六感比较强的星座女，判断能力准确，不轻易被人哄骗

主笔:老妖第六感称得上是一种比较神奇的能力了,有些时候仅仅是一些无凭无据的事情,也能够让我们做出比较准确的判断.就好比这几个星座的女生,在这方面能力比较强,判断力比较准确,无论你有着多么厉害的花言巧 ...

人的直觉判断能力真的靠谱吗？公式算出的答案是......

相关推荐