橘子OR蓝莓?这个例子让你精通贝叶斯定理

贝叶斯定理可能是数理统计与概率论领域最重要的定理。因此,该定理经常应用于数据科学领域。本文将通过实际问题对贝叶斯定理进行直观推导。

简介

以18世纪英国数学家托马斯贝叶斯命名的贝叶斯定理是确定条件概率的数学公式,其在数据科学领域具有重要意义。例如,贝叶斯定理的众多应用之一是统计推理的一种特殊方法---贝叶斯推理。

贝叶斯推理是在获得更多证据或信息时运用贝叶斯定理对假设概率进行更新的一种方法。贝叶斯推理已在广泛领域内得以应用,包括科学、工程、哲学、医学、体育和法律。

例如,在金融领域,贝叶斯定理可用于评估向潜在借款人提供贷款的风险。在医学领域,该定理可根据人们患病的可能性与测试的一般准确性来确定医学测试结果的准确性。

现在让我们看一些实际问题:

问题陈述

假设现有两个碗,X与Y,碗里都装满了橘子和蓝莓,并且你很清楚每个碗里有多少橘子和蓝莓。若我问你,从X碗里取出橘子的可能性是多少,那你能准确说出其概率。因为碗X里橘子和蓝莓共11个,其中3个是橘子,故取出橘子的概率是P(橘子)=3/11。

碗X和碗Y内都装满了橘子和蓝莓。

相反案例:

现进行随机抽取,取出的是一个蓝莓,并且假设我们不知其来自碗X还是碗Y,你能说出蓝莓是从哪个碗内取出的概率吗?

该问题可用贝叶斯推理来解答。

贝叶斯定理推导

为推导出贝叶斯定理,我们将进行一个模拟实验:掷骰子。当骰子的点数小于等于4时,从碗X内随机取出一个物品,当点数大于等于5时,则从碗Y内随机取出一个物品,重复进行300次(N=300)。简单起见,将上述物品简称为:

Blueberry:=B, Orange:=O, Bowl X: =X, Bowl Y:= Y

当一枚均匀骰子连续掷300次(N=300)后,我们将得到关于从两个碗里取出的物品数量的统计结果。该实验的假设结果如图1所示。其中,s代表碗或取出的物品的“来源”,y是可观察变量(蓝莓或橘子)。

图1:统计结果

该表显示:

  • 从碗X中取出蓝莓的次数为148: n(s=X, y=B)=148
  • 从碗Y中取出蓝莓的次数为26:n(s=Y, y=B)=26
  • 从碗X中取出橘子的次数为51: n(s=X, y=O)=51
  • 从碗Y中取出橘子的次数为75:n(s=Y, y=O)=75

根据这些统计数字,现提出一些有趣的问题:

从碗X中取出随机物品的概率为多少?

为得出此概率,即P(s=X),我们须用仅从碗X中取出的物品数除以总物品数N=300。这里,n(s=X, y=B)=148表示从碗X中取出的蓝莓数量,n(s=X, y=O)=51 表示的是从碗X中取出的橘子数量。由此,我们得出从碗X中取出随机物品的概率,如下:

公式1:从碗X中取出随机物品的概率

注意:该概率被称为“先验概率”。在贝叶斯统计推理中,先验概率是在数据收集前事件的概率。该案例中p(s=X)告诉我们的是从碗X中抽取随机物品的概率,但该物品是橘子还是蓝莓未知。

同样,从碗Y中取出随机物品的概率p(s=Y)为:

公式2:从碗Y中取出随机物品的概率

取出橘子或蓝莓的概率为多少?

这次我们想知道在不考虑特定碗的情况下取出橘子或蓝莓的概率。该概率可分别表示为p(y=O)和p(y=B)。计算方法与前一案例类似。我们用取出特定物品的次数除以总抽取次数,由此得出的概率可用公式3和公式4表示。如下:

公式3:取出橘子的概率

公式4:取出蓝莓的概率

从碗X中取出蓝莓的概率为多少?

现在我们来计算联合概率p(s=X, y=B),其表示的是从碗X中取出蓝莓的可能性。

注意:联合概率是指事件1与事件2同时发生时的概率。在该案例中,事件1是“从碗X中进行随机抽取”,而事件2是“取出的物品为蓝莓”。

该联合概率可用从碗X中取出蓝莓的次数除以总抽取次数来计算,如下:

公式5:从碗X中取出蓝莓的概率

同样,从碗Y中取出蓝莓的概率为:

公式6:从碗Y中取出蓝莓的概率

另外,从碗X中取出橘子的概率为:

公式7:从碗Y中取出蓝莓的概率

假定已对碗X进行随机抽取,那么取出的物品为蓝莓的概率为多少?

现在问题变得有趣了。让我们来计算第一个条件概率。在该案例中,可以确信的是我们从哪个碗中进行随机抽取,例如,我们从碗X中抽取。基于此,我们可以计算出从碗X中取出蓝莓的概率。

该条件概率可用p(y=B| s=X)表示,其中s=X表示该条件为“从碗X中进行随机抽取”。为计算出 p(y=B| s=X),我们须用从碗X中取出蓝莓的次数除以从碗X中取出的总物品数,如下:

公式8:给定条件为从碗X中随机抽取时,取出蓝莓的概率

乘积规则

现在让我们来看看第一个重要统计规则。这里我们用先前得出的从碗X中取出蓝莓的概率 p(s=X, y=B),然后通过分子分母同时乘以(n(s=X,y=B)+n(s=X, y=O))对该公式进行扩展,该扩展不会改变概率p(s=X, y=B)的值。

现在仔细观察该公式,就会发现 p(s=X, y=B)的新的表达式是由先前得出的其他两个概率p(y=B|s=X)和p(s=X)的乘积组成。

公式9:乘积规则

我们称概率间的这种关系为乘积规则。该规则可通过条件概率p(y=B| s=X)和先验概率p(s=X)来计算联合概率p(s=X, y=B)。

求和定则

现在,让我们重新看一下先验概率p(s=X ),其表示从碗X中取出随机物品的可能性。若将该公式分为两个被加数的和,如公式10第二行所示,可观察到被加数正是我们先前得出的两个联合概率。

公式10:求和规则

我们称此关系为求和规则。该规则可通过联合概率的相加计算出先验概率 p(X)的值。该联合概率包含先验概率中的随机变量 p(X)和任何其他随机变量y。

贝叶斯规则

在乘积规则中,联合概率中的随机变量的顺序无关紧要。因此 p(s,y)和p(y,s)的值相等。

公式11

如果让 p(s, y)和 p(y, s)的值相等,并进行重组,我们将得出p(s|y)的一个新的数学表达式。该表达式就是贝叶斯规则。

公式12:贝叶斯定理/法则

最后:蓝莓是从哪个碗里取出的?

贝叶斯定理为我们提供了条件概率 p(s|y)的计算公式,这正是我们最初问题的答案。

我们可用条件y=B来表示已取出蓝莓这一事实。为解答蓝莓从哪个碗里取出这一问题,须计算出 s=X和s=Y时各自的概率 p(s|y=B)的值。得出的这两个值能告诉我们从碗X或碗Y的取出蓝莓的可能性。

现在让我们来计算s=X时的值。幸运的是,我们需要的概率都已在前述部分计算得出。若将这些概率的值代入公式13 p(s=X|y=B)中,我们将得出以下结论:在已取出蓝莓的条件下,从碗X中取出该蓝莓的概率大约为86%。该计算方法与其他案例类似,如下:

公式13:贝叶斯定理

若没有贝叶斯定理,计算出概率 p(s|y)将会非常困难。不过,贝叶斯定理让我们通过更容易计算出的概率对此概率进行计算。贝叶斯定理的神奇之处就在于:用容易计算出的概率来表示难以计算的概率。

(0)

相关推荐

  • 贝叶斯学派与频率学派有何不同?

    要说贝叶斯和频率学派,那简直太有意思了.为什么这么说呢?因为两个学派的理解对于我来说真的是一场持久战.我是在学习机器学习的时候接触到的这两个学派,此前并不知道,当时就被深深吸引了,于是找了各种资料学习 ...

  • 浅谈频率学派和贝叶斯学派

    [写在前面的话] 终于可以写贝叶斯相关的文章啦,心情有点小激动,最近一段时间反复看Bishop老师编写的<<Pattern Recognition and Machine Learning ...

  • 【游戏】蓝莓+橘子+橙子+哈密瓜+椰子=大西瓜!

    文丨寒夜默姬 排版丨Arc翼执泠 "今天你合成大西瓜了吗?" 不知从什么时候开始,笔者单位的同事们都在玩一款小游戏--<合成大西瓜>.一开始,笔者并不怎么感兴趣,反正这 ...

  • 吃货美食:西兰花拌黑木耳、泡椒田鸡、酥皮蓝莓杯子蛋糕的做法

    西兰花拌黑木耳 1.将西兰花放入开水锅里烫1分钟,捞起立即用凉水冲凉,沥干水份,用花椒油和和盐拌均匀. 2.将蒜切丝,放入小碗中,倒入花椒油,酱油,醋和盐. 3.将发好的木耳,放入开水烫1分钟,捞起同 ...

  • 蓝莓不能和什么一起吃

    蓝莓应该是深受大家喜爱的一种水果,因为它的严重高,味道美,所以获得了一大批人们的喜爱,但是在喜爱它的同时,你有了解过它不能和哪些食物一起吃吗?让我们一起去看一看吧. 蓝莓不能和什么一起吃 蓝莓没有与它 ...

  • 吃蓝莓会导致上火吗

    相信大家在平常的生活中肯定都吃过蓝莓,相对来说,蓝莓也是比较美味的,而且它主要也是北方的一种水果,吃起来也是非常有营养的,大家在平常的生活中也可以进行一定的食用,相对来说,它的用处也很广泛,在生活中也 ...

  • 灵山蓝莓基地采风

            5月9日,母亲节,晴空万里,蓝天白云,江西省信江诗词楹联学社选择这个好日子在上饶广信区灵山脚下的双溪村召开年会,开展采风活动.         采风地点是清水乡双溪村蓝莓产业扶贫基地, ...

  • 蓝莓鳕鱼亮点:银鳕鱼是几年前进入苏州的原...

    蓝莓鳕鱼 亮点: 银鳕鱼是几年前进入苏州的原料,一直是采用中式烹调方法制作,这里在沿用中式烹调技法的同时加入了西式调料,增加了整道菜的时尚感. 味型: 浓郁的蓝莓酱香酸甜可口,加上鳕鱼的肥美鲜嫩. 原 ...

  • 蓝莓,如此浪漫的水果,吃货勿进,怕你忍不住口水

    作者简介 彭艺林 诗人,行者,浪子,祖籍山东.著有诗集<冰冻一个世纪>,散文集<长啸如谜>. 听说她徒步去了西藏,从此毫无音讯. 我坐在沙发上,面对着桌面散落的蓝莓.这是昨天父 ...

  • 美食精选:芋仔煮鸭、蛋煎鲅鱼、蓝莓山药的做法

    芋仔煮鸭 鸭子洗净沥干水,盐.味精.五香粉.柱侯酱涂在鸭上,腌两小时:芋仔刮皮洗净开平腐乳两块捣碎.一大匙羹海鲜酱.半匙羹柱侯酱.三匙羹味极鲜,加150克清水调好:把整只鸭及芋仔放进锅,倒入调好味的酱 ...

  • 美食精选:土豆寿司泥、沙律银雪鱼、蓝莓酸奶布丁的做法

    土豆寿司泥 土豆削皮切块,加入奶油,放在微波炉里高火转8分钟:锅里加入没过鸡蛋的水,水开后8分钟即可取出放凉:用勺子将土豆碾成泥,加入蛋黄,一起碾,搅匀:加入切好丁的蛋白和腊肠,搅匀,中间加入的盐:用 ...