为什么真正聪明的人都是概率高手?(零公式入门篇)
开始
懂概率的3个层级
1
懂得概率的人,才是真正聪明的人。
因为这个世界,不管是世俗层面,还是宇宙层面,都是依照概率运行的。
至少,概率包裹着人类的无知的最外面那一层。
然而,这个世界上极少有人真的懂概率。
我把“懂概率”分为3个层级:
层级一:懂概率计算;
层级二:懂概率思考;
层级三:懂概率行动。
这三个层级未必是递进的关系。
a、你是概率计算高手,也会艰深的概率思考,但未必一定是个概率行动高手。即使天才如凯恩斯,也是历经多年磨难,才最终跻身“层级3”;
b、有些人压根儿不会基本的概率计算,也不知道什么叫概率思维,但天生就是概率行动高手。例如那些德州扑克高手,交易员鬼才等等。
这或者是因为他们小时候的生活环境是个天然的概率训练场,或者是因为大脑本身就是一个概率机器。
2
有多少人懂得概率计算?
大约1%吧,实话说可能更少。
懂得概率计算的人里,有多少人懂得概率思考?
再来个1%。
懂得概率思考的人里,有多少人懂得概率行动?
还是1%吧。
不过,这么一算,全世界没多少人真正懂得概率行动了,而且这样计算也违背了我上面所说的,有些人天生就会概率行动而无需会计算。
所以,修正一下,把后面的两个1%改成10%。
于是,可以得出,有意识的概率行动者,大约万分之一。
也就是说,在千万级人口的城市里,有几千个“概率高手”。
你可能会说,不对吧,北上广深这些千万人口城市,每个地方光是亿万富翁都不止几千个吧?
有钱人虽然多,但很多只是靠运气,属于“随机漫步的傻瓜”,而非概率高手。
那么,“孤独大脑”公众号的订阅者接近50万,其中的概率高手只有不到50个人吗?
留个悬念,在文章最后揭开。
层 级 一
概率计算
1
假如想应对这个世界上的不确定性,与随机性共舞,你必须懂得概率计算。
那么,一个普通人到底要掌握多少概率公式,才够用呢?
我的答案是:零。
没错,你一个公式都不用记。
爱因斯坦说:
“科学知识不是大量莫名其妙的结论,它是每个人按照正确的思维方式自己应当并且也能够推导出的结论。
学习科学的过程,就是自己得出这个结论的过程。”
概率的公式本来就很简单,假如你能够拆掉这些公式,自己从头推导,你就永远不用去记这些公式。
对于那些熟悉概率公式的人,我也建议你一起来一次“从头推导”,这样你就会发现,几乎可以解决所有的“难度达到硅谷面试题级别”的概率趣题,绝对横扫“俗人圈儿”。
2
如何从头推导?
我想和你分享的是“平行宇宙法”。
比方说,我们扔一个标准的六面骰子,众所周知,你得到任何一个面的可能性都是1/6。
但是很多人即使懂得这个简单的道理,也没法从感官上理解。他会想:骰子落地,只会100%是某个数字,1/6有什么意义呢?
就像我有次和一个朋友聊特斯拉电动车的自燃率。我告诉他根据行驶里程,特斯拉官方公布的自燃率比燃油车低500%。
这个朋友说:不管你特斯拉总的自燃比例有多低,(一旦发生)对任何一个车主而言就是100%……电动车自燃也许是小概率事件,但对涉事车主来说,却是百分百的噩耗。
这就是聪明的概率无知者。
其实特斯拉的说法也有漏洞,因为他们应该和同等车龄同等级别的车对比,才够公平。不过,这个就是更聪明的人才能提出的问题了。
回到我们的“平行宇宙法”:
一个骰子在你扔出的瞬间,现有的宇宙分裂成了6个平行宇宙,如下:
所以,尽管现实中,看起来骰子落地的时候,只会是某个确定的一面朝上,但是当你(不作弊地)随机扔出骰子的时候,骰子的未来就分裂成了6个平行宇宙,分别是骰子落地之后的6个结果:1,2,3,4,5,6。
但是,我们的现实,只能选择6个宇宙中的一个。
因为标准骰子的六个面是一样的,所以6个宇宙平分了“未来的可能性”。
所以某一面出现的可能性,也就是概率,是1/6。
那么,扔一个骰子,得到偶数的概率是多少呢?
把2、4、6三个平行宇宙的三个1/6加起来,等于1/2。
懂得概率计算的人,一定会对我如此啰嗦表示不屑,请坚持一下,再往下看。
3
“平行宇宙论”,也叫多重宇宙论,或者叫多元宇宙论,指的是一种在物理学里尚未证实的假说:
在我们的宇宙之外,很可能还存在着其他的宇宙,而这些宇宙是宇宙的可能状态的一种反应,这些宇宙可能其基本物理常数和我们所认知的宇宙相同,也可能不同。
多重宇宙这个名词是由美国哲学家与心理学家威廉·詹姆士在1895年所提出的。
平行宇宙经常被用以说明:一个事件不同的过程或一个不同的决定的后续发展是存在于不同的平行宇宙中的。
(以上来自维基百科)
我个人对平行宇宙的理论不太感冒,但觉得用它来描述概率,非常直观。
而且,这能够让我们从哲学和“实在”层面,去理解概率里的“发生”和“未发生”。
例如,假如一件事情发生的概率是80%,但结果这件事情并没有发生。很多人会据此怀疑概率的意义。
借助于平行宇宙的理论,我们就能说,除了要验证80%发生概率的精确性,可以认为我们掉进了20%“不发生”的平行宇宙,这并不奇怪。
最近有位物理学家认为,我们处于上层宇宙的一个黑洞中。
这个新观点颇让人震惊:我们所知的宇宙,可能是从其他宇宙里面的“黑洞”诞生而来。大爆炸就是一个黑洞“炸出”另一个宇宙的过程。
我们对于充满不确定性的未来,对自己似乎“命中注定”的命运,对于比电影还要精彩(或是“还要悲催”)的现实,不可避免地会有一些疑惑和感慨。
4
让我们回到现实世界的概率话题。
现在我们把问题变成扔两个骰子。
请问扔两个骰子,得到两个6的可能性是多大?
太简单了,1/6✖️1/6=1/36。
但是,为什么要这么计算呢?
我知道你懂“两个独立事件A和B同时发生的概率等于A发生的概率和B发生的概率的乘积”,可我们说好了不用公式的呀。
所以,让我们继续用平行宇宙的可视化计算法。
扔两个骰子,其实是它们的宇宙分裂了两次,如下图:
第一次:扔第一个骰子时,宇宙分裂成了六个(绿色);
第二次:扔第二个骰子时,每个绿色的宇宙又分别分裂成了六个(蓝色)。
于是我们得到了36个平行宇宙。
现在我们来找一下,在36个平行宇宙里,有多少个是两个骰子都处于6的状态。
答案是只有一个(在右下角),所以,得到两个6的可能性是1/36。
用“平行宇宙法”,看起来复杂,但直观,而且可感知。
这正是爱因斯坦所说的:
每个人按照正确的思维方式自己应当并且也能够推导出的结论。
更关键的是,我们可以用这种零公式的方法,来解答更难的题目。
5
目前《老喻的人生算法课》正在“得到App”上卖,为了促进销量,主编要我在该App的社区“知识城邦”上陪聊。
大部分问题都是人生和工作难题,我尽量显得机智而有诚意地回答(目前已经快装不下去了)。偶尔也有数学题,例如下面这个:
这个问题看起来简单,我猜90%的人不会做。
会做的那10%,其中可能只有1%能说明白为什么这么做。
让我继续采用“平行宇宙法”清清楚楚地算一遍。
如题,因为1也可以是3,所以我们可以把问题简化,单个骰子得到3的概率是2/6=1/3。
在下图中:
用红球来标记1和3,出现的概率是1/3;
用黑球来标记其他可能,出现的概率是2/3;
扔三个球,作为独立事件,相当于爆炸了三次,如下图。
分裂了三次之后,一共产生了3✖️3✖️3=27种可能。
我们来检查一下,这27个平行宇宙中,有多少个是两个红色球?
如图,从右侧回溯到左侧,每条线上的三个球,就是该平行宇宙下的三球分布。
其中,画红钩的6个符合条件。
所以,答案是:6/27=2/9。
我们也可以用排列组合法来做:
1/3✖️2/3✖️1/3✖️3=6/27=2/9。
但我们说了,不用一个公式。
(开始提问者后半截的问题,摇骰子,得到三个3(1也可以是3)的概率是1/27。)
6
下面这道题,已经进入高手级别了,但是我们依然不用任何公式。
更好玩儿的是,你甚至可以用下面这道题让普通人迷惑的地方,在酒吧里和人打赌。当然,不是真赌哈。
帽子里有三张卡片。一张两面都是红色(“红-红”),一张两面都是白色(“白-白”),一张一面红色一面白色(“红-白”)。
从里面随机抓出一张卡片扔向空中,落地后红色一面朝上。问:这张卡片是“红-红”的概率是多少?
请你准备三张纸片,写成上面的样子,以便更直观地思考。
看起来很简单啊,根据已有信息,这张牌要么是(“红-红”)那一张,要么是(“红-白”),二者出现的可能性是一样的,所以是“红-红”的概率是50%,不是吗?
正确答案是:2/3。
《不确定世界的理性选择》一书中,对此给出了清晰直观的解答。
正确的问题表征是根据卡片的面,而不是整张卡。
所有结果的样本空间包括六个事件——每张卡片的每一面各为一个事件。
由于红色的一面向上,因此在“有效样本空间”中共有三个事件:红白(红面向上)、红-红(一个红面向上)、红-红(另一个红面向上)。
因此正确答案是 2/ 3——三个等概率事件中,其中两个是红-红。
我们的错觉在于,红-红这张牌每回只能出现一次,为什么其两面可以“拆”成两个独立事件呢?
我们用穷举法,以“概率树”的形式,也就是我们上面所说的“平行宇宙法”,加上书中的配图(如下),更容易理解:
三张牌可以分裂成(上图右侧的)6个平行宇宙,牌面是红色的有3个,这3个中,有2个是红-红牌。
你看,这道题看似非常简单,能答对的人极少。而且会有人看了答案都不服,最好的办法就是做三张牌,实际玩儿上几把,不服就来真的。
7
其实,“平行宇宙法”就是一种穷举法。
只不过我把动态过程加进去,因为有了时间、空间,以及“分裂”这个动作,我们就可以让这个计算过程可视化,可感知。
这样以来,也就更可以在“为什么”的基础上思考。
“为什么”,是一个非常伟大的词汇,本系列文章的后两篇,“为什么”是主角之一。
追问“为什么”,也是概率计算的“第一性原理”。
一旦做到了这一点,你就是真正聪明的概率高手。
8
能否进行概率计算和思考,的确是评判一个人是否真聪明的硬指标。
1968年夏天,爱德华·O·索普遇见了沃伦·巴菲特共进晚餐。索普是一位数学家,曾经在赌场攻克了21点游戏,后来又在资本市场上大展身手,是量化金融的先驱。
两个聪明人在一起自然要过招。巴菲特决定考验一下索普,题目如下。
有三个奇异骰子,每一个骰子最多有2个或3个不一样的数字。用这些特殊的骰子来玩1个赌博游戏:
你可以选这3个中“最好”的那个,而我拿剩下的2个中“最好”的。我们一起掷出,数字大的获胜。
即便你选择了那个你认为“更好”的骰子,我也总是能够从平均统计值上战胜你。对绝大部分人来说,这里最不可思议的一点在于,根本不存在所谓“最好”的骰子。
坦率说,这个题目让许多人困扰,因为他们认为应该遵守数学上所谓的传递规则:若A优于B,B优于C,则A优于C。
索普答出了巴菲特的难题。
如果骰子如下:A的六面数字是(3,3,3,3,3,3),B是(6,5,2,2,2,2),C是(4,4,4,4,1,1),
那么统计平均显示,A对B的胜率有2/3,B对C有5/9,C对A有2/3。
所以说,这是三个非传递骰子,不管你先选哪一个,我都能找出一个在概率上赢了你。
什么意思呢?我们继续用基于“平行宇宙法”的穷举法,来证明索普的结论。只是我不再能画成简单的分叉图了。
以B对C为例,示意如下:
横向的红色,是B的六种可能。纵向的蓝色,是C的六种可能。
二者对决,36个格子就是36种可能,也就是说,会有36个平行宇宙。
这当中,红胜20次(打红钩的情况下),所以B的胜率是20/36=5/9。
你看,全世界最聪明人的难题,也不用一个公式,就能够解得清清楚楚。
8
概率计算,普通人只要知道这么多,就够了吗?
几乎是。
但最好再加上另外一种,就更完整了。
我们先来一道传说中的谷歌面试题:
假设在一段高速公路上,30分钟之内见到汽车经过的概率是0.95。那么,在10分钟内见到汽车经过的概率是多少?(假设缺省概率固定)
解题思路如下:
1、可以把30分钟的这个结果,当作是三个10分钟的叠加,就像扔三个骰子一样;
2、30分钟之内见到汽车经过的概率是0.95,可能是经过一辆车,也可能是几辆车。所以我们就倒过来想,30分钟见不到任何车的概率是0.05。
3、30分钟见不到任何车,意味着三个10分钟,连续都见不到任何车。我们假设每10分钟见不到车的概率是y。
所以,这三个10分钟同时发生见不到车的概率,就是y✖️y✖️y,原理和上面第“4”节的思路一样。
因此在10分钟内见不到任何车辆的概率,是0.05的立方根。
而在10分钟内见到一辆车的概率,则为1减去此立方根(因为“见到车”和“见不到任何车”的可能性之和为100%)。
答案是大约63%。
9
类似思路的“用1减”,最有名的题目就是所谓的“生日悖论”:
如果在一个房间,至少要有多少人,可以令“其中某两个人的生日是同一天”的概率大于50%?
答案是23人。
这个数字远比直觉要低得多。我很早以前喜欢拿这个错觉和人打赌,赢了好多回。
具体计算方法也不难,简述如下:
1、这个问题也要倒过来想,计算连续多个人生日都不重合的概率;
2、我们假设人们是按顺序一个个进入房间。第一个人随便占了365天的一天,概率是365/365;
3、第二个人只有占剩下364天的一天,才能不和第一个人重合,概率是364/365;
4、依次类推,第三个人只有占剩下363天的一天,才能不和前两个人重合,概率是363/365;
......
前五个人生日完全不重合的概率是:1×364/365×363/365×362/365×361/365=97.3%。
也就是说,看起来似乎不重合的可能性很大。
但是随着人数的增多,不重合的可能性加速降低。
这有点儿像另外一种形式上的“复利效应”。
当人数达到23的时候,不重合的概率已经低于50%了。
当房间里有50人时,至少有两个人生日重合的概率已经高达近97%了。
类似的算法,还可以用来在饭桌上打赌,至少有两个人是同一个星座。
请问,饭桌上有几个人的时候,你愿意和别人打这个赌?
10
即使我宣称了“零公式”,你能坚持看到这里,也很不容易。
但绝对是值得的。
据科学家说,人类的大脑可能天生就是一个懂得贝叶斯概率算法的机器。
但只是一个隐形的机器。
事实上,人类很晚才懂得如何计算概率,所以人类大脑很难对概率计算形成直觉判断。
计算机、大数据、人工智能的加速发展,以及金融市场和全球化经济的进程,令概率成为现代人必备的“底层算法”。
本文是系列文章的第一篇,后面两篇会接着写“概率思考”和“概率行动”。