神奇的预测

我很喜欢《思维的发现》这本书。

作者很聪明,讲故事而不写计算,尽管主角之一阿莫斯是个数学高手。

其中有段写到一个经典的实验:

密歇根大学沃德·爱德华兹实验室里做了个研究,主题是:

人类在决策制定过程中如何对新信息做出反应。

实验是这样的:

  • 研究人员把满满两口袋筹码放在被试面前,每只口袋里都有红白两种颜色的筹码。

  • 一号口袋里,75%的筹码是白色,25%的筹码是红色。

  • 二号口袋里正好相反,75%是红色,25%是白色。

  • 被试随机挑选一只口袋,然后把筹码一个接一个往外拿,其间不得向袋子里面看。

  • 每拿出一个筹码,他都需向研究人员汇报他的猜测:他手中的袋子究竟是白色筹码居多,还是红色筹码居多?

这其实是一个贝叶斯计算。但实验的目的不是测试数学,而是测试人类对概率的直觉。

比方说,你摸出了一个红球,让你猜,这个球来自一号口袋还是二号口袋?可能性是多大?

然后你又摸了一个,还是红球,你可以再根据这个信息来调整你的猜测。

刘易斯写了这个实验,但是并没有给出计算,尽管这个计算很简单。

但这个计算很有趣,而且非常令人疑惑。

请允许我画一下:

第一个球的计算很简单,即使不用所谓贝叶斯也能够理解,一号口袋里有1/4的红球,二号口袋里有3/4的红球。这不很简单嘛,干嘛还要列个公式?

第二个球还是红球,这相当于连续发生,所以就是概率相乘:

第三个球还是红球,继续概率相乘:

这里面好玩的地方是:

研究表明,当被试从口袋中抽出的是红色筹码时,他们更倾向于认为该口袋里红色筹码占多数。假如他们抽出的头三个筹码都是红色,那么他们认为袋中筹码以红色为主的概率就变成了之前的3倍。

他们的判断没错,只不过,根据贝叶斯定理的计算结果,概率其实变成了之前的27倍。换言之,他们的判断方向是正确的,就是转换的幅度没有那么大。

这里面让人迷惑的是概率叠加。

人们对一层概率的感觉还是可以的,但是多层概率相乘,就会有点儿绕不过来。

比方说,还是上面的题,请问:

现在连续在某个口袋里摸出了三个红球,该口袋是二号的概率是多大?

根据上面的计算,来自二号口袋的概率是27/(1+27)=96.42%。

我一直打算讲一下这本书里的这个实验。

我感兴趣的地方,不是计算本身,而是根据更新的信息,逼近真相的速度。也就是预测能力。

大脑在面对信息时,会有一个加工的过程。这种加工能力,决定了大脑厉害与否,以及一个人能否在现实世界里做出更聪明的决策。

如上计算,每摸到一个红球,是二号口袋的概率就会乘上3倍。三次的话,就是3的三次方,也就是27倍。

这种指数式的增长,可能是贝叶斯推理的神奇力量所在。

以后我应该会单独写篇掺杂了鸡汤和成功学的票房文章吧。

也许你会觉得上面这道题太简单了。

那就继续。

《决策与判断》这本书也不错,虽然看起来并不容易。

书里写道,人们都有保守主义情结,即使出现了新信息,也不愿意根据新信息来更新先验概率。

简单点儿说,就是人们一方面会忽略基础概率,另外一方面,又不擅长用信息来更新概率。

再进一步,假如信息在连续更新,那么人的大脑就更绕不过弯儿了(例如上面的3的三次方)。

看一个书里的题:

  • 两个各装了100个球的箱子;

  • 甲箱子中有70个红球,30个绿球,乙箱子中有30个红球,70个绿球;

  • 随机选择其中一个箱子,从中拿出一个球记下球色再放回原箱子;

  • 如此重复12次,记录得到8次红球,4次绿球。

请问:被选择的箱子是甲箱子的概率有多大?

看到这道题,你也许就想用贝叶斯公式套一下吧?

其实还是不用。

摸到一次红球,来自甲箱子的概率是0.7,来自乙箱子的概率是0.3。

我们也可以表述为来自甲箱子的可能性是来自乙箱子的7/3倍。

由于摸出来球的颜色的顺序并不重要,所以连摸8次红球,来自甲箱子的可能性是来自乙箱子的7/3倍的八次方。

但是又摸了4次绿球,这就像可能性的反转,因为摸一次绿球,来自甲箱子的可能性是来自乙箱子的3/7倍,正好倒过来了。

既然是4次,那就是3/7倍的四次方。

“7/3倍的八次方”与“3/7倍的四次方”相乘,约等于39.06,这就是箱子是甲箱子的可能性相对于是乙的可能性的倍数。

所以,来自甲箱子的可能性是39.06/(39.06+1)=97.5%

(书中答案是97%。我上面是自己快速算了一下,未经确认正误。)

该书讲这个例子,其实也是做了个测试,让大家根据摸球(书中是抓扑克牌)的结果,来猜概率。

结果呢?

如果你的答案和大多数人一样,你会认为概率在70%到80%之间。从本质上讲,你将原先的随机概率50%(两个箱子是随机选择的)调整到了70%到80%之间,主要是因为抽出的红色球大于绿色。

但是根据贝叶斯法则,正确的答案应该是97%(详细计算见Edwards,1968)。比起数据可以允许的改变来,绝大多数人对概率估计作出的改变要保守得多。

人的大脑对叠加的概率还真不拿手。

在概率理论中,单个的事件被认为是“简单”事件,同时多个事件被认为是“复合”(compound)事件。

书里说,研究者发现:这样的结果显示,人们在判断连续事件发生的概率时倾向于高估,而判断非连续事件发生的概率时倾向于低估(Barclay&Beach,1972;Wyer,1976)。

这里又有一点点小绕,既然偏向于高估连续事件发生的概率,为什么上面的实验,人们低估了来自甲箱子的概率呢?

书里没写这个。

我想,那是因为,我们是根据摸出来的球的颜色所提供的新信息来计算“逆概率”,所以关于高估低估是反过来的。这里面的小绕就不说了。

但我感兴趣的,和研究者们的话题不一样。

你发现没有,上面两个箱子里,一共有200个球,但是我们只通过摸了12次,就将球来自甲箱子的可能性提升到了97%。

这可能就是贝叶斯用来预测的神奇力量之所在了。

(0)

相关推荐