Z分布与t分布

作者:Ling   审稿:石鹏  封面:吉江

Z分布

基本介绍

Z分布,又称作标准正态分布,是正态分布中的一种。那什么是正态分布呢?

正态分布 也叫常态分布,是连续随机变量概率分布的一种,自然界、人类社会、心理和教育中大量现象均按正态形式分布,例如能力的高低,学生成绩的好坏等都属于正态分布。它随随机变量的平均数(

)、标准差(

)的大小与单位不同而有不同的分布形态。

图1(via.网络)

形态与两个参数

μ 是正态分布的位置参数,描述正态分布的集中趋势位 置。概率规律为取与μ邻近的值的概率大,而取离μ越远的值的概率越小。正态分布以X=μ为对称轴,左右完全对称。正态分布的期望、均数、中位数、众数相同,均等于μ

σ 描述正态分布资料数据分布的离散程度 ,σ越大,数据分布越分散,σ越小,数据分布越集中。也称为是正态分布的形状参数,σ越大,曲线越扁平,反之,σ越小,曲线越瘦高。

特征
  1. 正态曲线的高峰位于正中央,即 均数 所在的位置。

  2. 正态曲线以均数为中心,左右对称,曲线两端永远不与 横轴 相交。

  3. 正态曲线由均数所在处开始,分别向左右两侧逐渐均匀下降。

  4. 曲线与横轴间的面积总等于1,即频率的总和为100%。

Z分布

标准正态分布(Z分布) 是正态分布的一种,其平均数和标准差都是固定的,平均数为μ=0,标准差为σ=1

图2.(via.网络)

上图的Z分布中,我们可以看出Z分布曲线所围成的面积(P值)被划分为好几个部分,这是因为在实际工作中,正态曲线下横轴上一定区间的面积反映该区间的例数占总例数的百分比,或变量值落在该区间的概率(概率分布)。不同范围内正态曲线下的面积可用公式计算,具体的公式在这就不多做展开,但是以下这些是需要牢记的:

横轴 区间(μ-σ,μ+σ)内的面积为68.268949%;

横轴区间(μ-1.96σ,μ+1.96σ)内的面积为95.449974%;

横轴区间(μ-2.58σ,μ+2.58σ)内的面积为99.730020%;

(可与上图一一对照,结合画图来记忆)

Z分布的“3σ“原则

由于“小概率事件”和假设检验 的基本思想 “小概率事件”通常指发生的概率小于5%的事件,认为在一次试验中该事件是几乎不可能发生的。由此可见X落在(μ-3σ,μ+3σ)以外的概率小于千分之三,在实际问题中常认为相应的事件是不会发生的,基本上可以把区间(μ-3σ,μ+3σ) 看作是随机变量X实际可能的取值区间,这称之为正态分布的“3σ”原则。

t分布

基本介绍

在 概率论 和 统计学 中,学生t-分布t-distribution),可简称为t 分布,用于根据小样本来估计呈正态分布且方差未知的总体的均值。如果总体方差已知(例如在样本数量足够多时),则应该用正态分布来估计总体均值。

因此这就是在实际生活中为什么我们更多的是使用t检验而非z检验了。

形态与参数(df)

t分布曲线形态与n(确切地说与自由度df)大小有关。与标准正态分布曲线相比,自由度df越小,t分布曲线愈平坦,曲线中间愈低,曲线双侧尾部翘得愈高;自由度df愈大,t分布曲线愈接近正态分布曲线,当自由度df=∞时,t分布曲线为标准正态分布曲线。

图3.(via网络)

定义:设X1服从标准正态分布N(0,1),X2服从自由度为n的χ2分布,且X1、X2相互独立,则称变量t=X1/(X2/n)1/2 所服从的分布为自由度为n的t分布。

特征

1.以0为中心,左右对称的单峰分布;

2.t分布是一簇曲线,其形态变化与n(确切地说与自由度df)大小有关。自由度df越小,t分布曲线越低平;自由度df越大,t分布曲线越接近标准正态分布(u分布)曲线;

3.随着自由度逐渐增大,t分布逐渐接近标准正态分布。

Z分布与t分布的关系

在总体已知的条件下,根据Z分布;在总体未知需要通过参数来估计总体时,根据t分布。

Z分布是固定的形态分布(均数为0,标准差为1),t分布是随着df值得变化的一簇函数。

在数据分析中,Z分布可以通过面积关系来计算概率,置信区间和假设检验,t分布则需要计算出t值,进行概率,置信区间和假设检验。

在实际生活中,由于总体未知的情况,更多地通过t分布来进行数据分析。

(0)

相关推荐