违反直觉的概率事件
数学是有趣且美妙的,但是有时候它却会让你失去信心,甚至在别人面前出丑。这是因为在一些看起来非常直观的数学问题的背后,往往隐藏着你容易忽略的简单逻辑,导致你在计算的时候“栽跟头”。算错往往不是因为你不懂,而是数学其实是一个非常巧妙的“伪装者”,它常常让你忘记了它其实是戴着面纱的。本文介绍了3例违反直觉的概率事件。
三门问题
第一个事件是三门问题。1963年的一个美国电视游戏节目《让我们做个交易》中,一个叫做蒙蒂·霍尔的主持人提出了该问题。三门问题是这样描述的:你作为一个玩家在玩一个游戏——在你前面分别有左、中、右三扇门,一扇门后面有一辆汽车,其余两扇门后面分别是一只山羊。你有一次开门的机会,如果你打开了后面停着汽车的门,你就能赢走这辆汽车。如果你打开了其他的门,那你将什么都得不到。
你肯定是不会知道每扇门后面是什么的,庄家则一清二楚。当你选中一扇门时(假设此门为1号),庄家就会挑选另一扇门(假设是3号),3号门的后面是一只山羊。然后庄家问你:你想改变你的选择吗?要不改选2号门?这时你自然而然地认为,只剩下两扇门了,且一扇是山羊一扇是车,不管选择1号还是2号,获得车的概率都是1/2,就不用改变选择了吧。然而,如果你这样想,你就错了!事实上,如果你改选2号门,你赢得汽车的概率是2/3。如果你坚持1号门,你赢得汽车的概率只有1/3,这是为什么呢?
左、中、右三扇门,门后的物体有三种可能的排列——1:车、羊、羊;2:羊、车、羊;3:羊、羊、车。门的位置是不变的,但号码是可以变的——你挑的门为1号门,庄家开给你看的为3号门。我们假设你挑选的是左门,即左门为1号门(哪个门作为1号门都是一样的)。对于第一种情况而言,中门和右门哪个作为2号门(3号门)的结果都是一样的,即你只有坚持原选择,你才能赢得车;对于第二种情况,庄家会打开右门作为3号门给你看,因为这扇门后是一只羊,而你只有改变选择,选择2号门的中门,才能赢得车;而对于第三种情况,庄家会给你看中门,而你只有改变选择,选择作为2号门的右门,你才能赢。所以以上三种情况,有两种情况是改变选择才能赢,只有一种情况是坚持选择才能赢。综上,改变选择赢的概率是2/3,而坚持选择赢的概率是1/3。所以,为了更可能赢车,你还是改选2号门吧。
8名囚犯的问题
第二个事件是这样的,分别被标号为1~8的8名囚犯获得了一个被集体释放的机会,但他们需要通过一个游戏:他们将按号码顺序陆续进入一个房间。该房间里面有8个抽屉,每个抽屉里面有一个小纸条,纸条上面有一个号码,号码为1~8中的一个且不重复,且纸条是随机放在抽屉里的。每个囚犯分别轮流进入房间,进去后的囚犯最多被允许打开任意4个抽屉,如果这4个抽屉里面有写着这个人序号的纸条,这个人就算赢。上一个囚犯将所有的东西还原并且出去后,下一个囚犯才能进来。一旦游戏开始,即第一个人进入房间,所有的囚犯将不得再交流。8名囚犯必须全部赢,他们才能被释放。一旦有一名囚犯输了,这群人将全部被枪毙。
这个游戏可比上一个游戏残酷多了!因为对于一名囚犯来说,写有他的号码的纸条在他所挑选的4个抽屉里面的概率为4除以8,即1/2。
每一名囚犯都是独立做挑选工作的,且互不干扰,所以8囚犯全部赢的概率为(1/2)8≈0.0039,甚至还不足千分之四。这个概率太小了,有同学看到这里会认为这群囚犯很难活得了,这个游戏极其不公平!但事情真的只能是这样吗?
实际上,如果囚犯们采取一种共同的策略,就可以使所有人都赢的机会大大增加,这个概率甚至超过了30%。那么这是什么策略呢?我们把抽屉按1~8的顺序从左到右给抽屉编号。我们规定序号为X的囚犯第一个必须打开序号为X的抽屉,然后按照X序号抽屉里面的号码Y,确定下一个打开的抽屉的序号。按照这种模式,一直找到自己的号码为止,或者用完能够抽取的抽屉的次数。我们利用一种布局来说明一下这种策略。
由1号囚犯开始,他打开了1号抽屉,看到了号码4。然后打开抽屉4,看到了号码3,再打开抽屉3,看到了号码1,他赢了。
对于2号囚犯:抽屉2 →抽屉6 →抽屉5 →抽屉7,赢了
对于3号囚犯: 抽屉3 →抽屉1 →抽屉4,赢了
对于4号囚犯: 抽屉4 →抽屉3 →抽屉1,赢了
对于5号囚犯: 抽屉5 →抽屉7 →抽屉2 →抽屉6,赢了
对于6号囚犯: 抽屉6 →抽屉5 →抽屉7 →抽屉2,赢了
对于7号囚犯: 抽屉7 →抽屉2 →抽屉6→抽屉5,赢了
对于8号囚犯: 抽屉8,赢了。至此,所有人都会被释放。
我们发现,对于这种布局,无论谁去打开抽屉,他都将陷入三种循环(如下)中的其中一种。而之所以每个人都能赢,是因为这三种循环含有的抽屉数都不多于4个,这意味着任何人都能在4次选择之前找到自己的号码。
一:抽屉1→抽屉4→抽屉3 →抽屉1
二:抽屉2 →抽屉6 →抽屉5 →抽屉7→抽屉2
三:抽屉8本身循环
然而,如果换一种布局,情况可就不那么妙了。例如下面这一种:
这里面只有一个循环:抽屉1→抽屉4→抽屉3 →抽屉8→抽屉2→抽屉6 →抽屉5→抽屉7→抽屉1。这个循环含有全部8个抽屉,任何人要想翻出自己的号码,都得开完8个抽屉。看来,这种策略有时会面临好运,有时会面临厄运。
但我们在意的是成功的概率。首先得提一下客观事实,含有超过一半数量——4个的抽屉的循环(可能含有5、6、7或8个抽屉)最多只有一个,因为抽屉总量是8个。而一旦存在含有超过4个抽屉的循环,意味着一定会有人失败。经过计算,不含有超过4个循环的布局发生的概率约为0.365(学过排列组合的同学可以自己算下),这也是这种策略的成功率,这个数字远大于千分之四。
辛普森悖论
第三个事件是这样的:根据下面两个表格所显示的数据,你认为迈克尔·乔丹和雷吉·米勒哪一个投篮命中率最高?
乍一看,雷吉·米勒的三分命中率和2分命中率都比迈克尔·乔丹高——52%>51%、38%>29%,我们就很容易得出雷吉·米勒的命中率比迈克尔·乔丹高的结论。然而事情却并非直观印象所显示的那样——迈克尔·乔丹的命中率更高!因为三分和两分的命中率所占的比例是不一样的,我们不能简单的将三分和两分的命中率分别直接对比,这就是辛普森悖论。平均下来,迈克尔·乔丹的命中率是49%,而雷吉·米勒的命中率是47%,迈克尔·乔丹技高一筹。这是怎么算的呢?
其实,这个很简单,因为命中率和场均分数无关,我们只需要将场均命中的次数除以场均尝试的次数就可以了。对于迈克尔·乔丹来说,其场均命中率为(21.2×51%+1.7×29%)/(21.2+1.7)≈49%,按照同样的方法算得雷吉·米勒的场均命中率约为47%。结果很惊讶吧?