贝叶斯推断 1. 基本概率模型和贝叶斯定理

这里简单介绍三个概念,古典概型,频率学派,贝叶斯学派。

  1. 古典概型
    这个模型下,随机实验所有可能的结果是有限的,并且每个基本结果发生的概率是相同的
    比如:投掷一枚均匀硬币,结果只有两种(假设硬币没有立起来),正面朝上和反面朝上,那么正面朝上的的概率就是0.5。这是基于古典概率模型的计算。

  2. 频率学派
    认为待估计参数是某个未知的常量,通过多次试验,统计事件发生的次数占总试验的比值,得到待估计参数的值。
    比如:估算投掷一枚均匀硬币获得正面的概率。我们进行1000次试验,有498次朝上,所以获得正面的概率是0.498。

  3. 贝叶斯学派
    认为待估计参数不是某个固定的常量,而是一种随机变量(服从某种分布)。关于这个随机变量,我们可以根据常识或其他客观事实对其有一个先验的分布估计(信念),之后根据试验来调整这个分布,最后求得该随机变量的后验分布。
    这种思想解决了频率学派试验中当试验次数过少而导致的试验偏差的问题,比如,投掷一枚匀质硬币5次,这5次都是正面朝上,根据频率学派观点,认为硬币投掷正面朝上的概率是P(正面朝上)=55=1P(正面朝上)=55=1,这显然是不符合常理的。
    现在定义事件A=(投掷一次硬币正面朝上),B=(投掷5次硬币,5次朝上)。在贝叶斯的框架下,我们根据常识认为投掷硬币正面朝上的概率是0.5,所以我们可以假设这个先验服从参数为Beta(10,10)Beta(10,10)的分布,然后根据贝叶斯定理P(A|B)=P(A)P(B|A)P(B)P(A|B)=P(A)P(B|A)P(B)可计算出在事件B发生的条件下的A的概率分布为分布Beta(15,10)Beta(15,10),这个分布的期望值是0.6。通过贝叶斯框架,我们计算出硬币正面朝上的概率仍然是一个接近0.5的值,更加符合我们的常识。(关于Beta分布和后验概率的具体计算会在以后的章节介绍)
    这个图是分别绘制的先验分布Beta(10,10)Beta(10,10)(蓝色)和后验分布Beta(15,10)Beta(15,10)(绿色)

条件概率和相互独立

条件概率,若P(B)>0P(B)>0,则P(A|B)=P(AB)P(B)P(A|B)=P(AB)P(B)记为事件B发生的情况下,A发生的概率。
如果P(A|B)=P(A)P(A|B)=P(A),则A与B相互独立且,P(A∩B)=P(A)P(B)P(A∩B)=P(A)P(B)

贝叶斯定理

离散形式
P(Bi|A)=P(Bi)P(A|Bi)∑nj=1P(Bj)P(A|Bj)=P(A∩B)p(A)P(Bi|A)=P(Bi)P(A|Bi)∑j=1nP(Bj)P(A|Bj)=P(A∩B)p(A)
连续形式
f(θ|y)=f(y|θ)f(θ)f(y)=f(y|θ)f(θ)∫f(y|θ)f(θ)dθ=likelihood×priornormalizingconstant∝likelihood×priorf(θ|y)=f(y|θ)f(θ)f(y)=f(y|θ)f(θ)∫f(y|θ)f(θ)dθ=likelihood×priornormalizingconstant∝likelihood×prior

单元随机变量的常用分布

  1. 伯努利分布(0-1分布) Bernoulli
    概率分布为

    pn={1−ppn=0n=1pn={1−pn=0pn=1

    期望E(x)=pE(x)=p,
    方差Var(X)=p(1−p)Var(X)=p(1−p)

  2. 二项分布binomial
    充分n次的独立的伯努利试验。N次独立试验中,事件发生K次的概率分布
    P(X=k)=Cknpk(1−p)n−kP(X=k)=Cnkpk(1−p)n−k
    期望E(X)=npE(X)=np
    方差Var(X)=np(1−p)Var(X)=np(1−p)

  3. 均匀分布Uniform
    去间a,b之间的均匀分布的概率密度函数

    f(x)={1/(b−a)0a<x<b其他f(x)={1/(b−a)a<x<b0其他

    期望E(X)=a+b2E(X)=a+b2
    方差Var(X)=(b−a)212Var(X)=(b−a)212

  4. 指数分布
    参数为λλ的指数函数的概率密度
    f(x)={λe−λxx>00x≤0f(x)={λe−λxx>00x≤0
    期望E(X)=1λE(X)=1λ
    方差Var(X)=1λ2Var(X)=1λ2

  5. 正态分本
    均值为μμ,标准差为σσ的正态分布的概率密度
    f(x)=12π√σe(x−μ)22σ2f(x)=12πσe(x−μ)22σ2
    期望E(X)=μE(X)=μ
    方差Var(X)=σ2Var(X)=σ2

(0)

相关推荐

  • 贝叶斯学派与频率学派有何不同?

    要说贝叶斯和频率学派,那简直太有意思了.为什么这么说呢?因为两个学派的理解对于我来说真的是一场持久战.我是在学习机器学习的时候接触到的这两个学派,此前并不知道,当时就被深深吸引了,于是找了各种资料学习 ...

  • 当我们在谈论贝叶斯时我们在谈论什么:用贝叶斯的眼光看世界

    本文来源图灵教育,作者方弦,[遇见]已获网易平台转发授权. 你跟朋友逛购物中心,时至中午,你们打算吃点东西.面对众多餐馆,你们会怎么办? 也许你们真的一无所知,随便挑了一家餐馆,但毕竟世上没多少&qu ...

  • 浅谈频率学派和贝叶斯学派

    [写在前面的话] 终于可以写贝叶斯相关的文章啦,心情有点小激动,最近一段时间反复看Bishop老师编写的<<Pattern Recognition and Machine Learning ...

  • R语言贝叶斯推断与MCMC:实现Metropolis-Hastings 采样算法示例

    原文链接:http://tecdat.cn/?p=21545 示例1:使用MCMC的指数分布采样 任何MCMC方案的目标都是从"目标"分布产生样本.在这种情况下,我们将使用平均值为 ...

  • R语言stan进行基于贝叶斯推断的回归模型

    原文连接:http://tecdat.cn/?p=6252 R的Stan 可以从许多统计软件包中运行Stan.到目前为止,我一直在从R运行Stan. 简单线性回归 第一步是为Stan模型编写文件.这包 ...

  • 【大杀器】贝叶斯推断

    简单的贝叶斯推算 人生有许多悖谬,其中一个是我们天生就会,而且习惯性地做贝叶斯推算,但几乎没人能算得准确.好比小朋友学数学,就算会了公式,还是永远粗心总做错.不是一个人,几乎所有人都这样,我们无时不刻 ...

  • t-GARCH 模型的贝叶斯推断理论

    R语言实例链接:http://tecdat.cn/?p=17494 实际处理中,发现金融数据存在尖峰厚尾现象.所以我们选择扰动项服从 t 分布的 t-GARCH 模型来描述波动性过程.t-GARCH( ...

  • PYTHON贝叶斯推断计算:用BETA先验分布推断概率和可视化案例

    原文链接:http://tecdat.cn/?p=24084 在这篇文章中,我将扩展从数据推断概率的示例,考虑 0 和 1之间的所有(连续)值,而不是考虑一组离散的候选概率.这意味着我们的先验(和后验 ...

  • R机器学习:朴素贝叶斯与支持向量机的原理与实现

    今天要给大家介绍的依然是两个分类算法,The naive Bayes and support vector machine (SVM),两个算法的原理有些许不同,不过还是放一篇文章中吧,毕竟我的文章都 ...

  • 机器学习算法集锦:从贝叶斯到深度学习及各自优缺点

    本文转自:视学算法 在我们日常生活中所用到的推荐系统.智能图片美化应用和聊天机器人等应用中,各种各样的机器学习和数据处理算法正尽职尽责地发挥着自己的功效.本文筛选并简单介绍了一些最常见算法类别,还为每 ...

  • 被嫌弃的贝叶斯派的逆袭,没有一个现代人的生活与它毫无关系

    多数人第一次听说贝叶斯定理应该是在中学课堂上.那个公式看起来并不复杂,在一众花里胡哨的考点中显得平平无奇. 但是很快,我们就知道了什么叫深藏不露.从高校教材到研究实战,贝叶斯这三个字频繁地出现在信息科 ...

  • 全栈必备 贝叶斯方法

    数据的重要性毋庸置疑,但是如何让数据产生价值呢? 对一个全栈老码农而言,经常在开发或者研发管理的时候遇到各种预测.决策.推断.分类.检测.排序等诸多问题.面对"你的代码还有bug么?&quo ...