概率统计专题47:大势所趋 - 正态分布

概率统计专题47:大势所趋 - 正态分布

(

全国I卷理)为了监控某种零件的一条生产线的生产过程,检验员每天从该生产线上随机抽取16个零件,并测量其尺寸(单位:cm).根据长期生产经验,可以认为这条生产线正常状态下生产的零件的尺寸服从正态分布

.

(1)假设生产状态正常,记X表示一天内抽取的16个零件中其尺寸在

之外的零件数,求

及X的数学期望;

(2)一天内抽检零件中,如果出现了尺寸在

之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.

(ⅰ)试说明上述监控生产过程方法的合理性;

(ⅱ)下面是检验员在一天内抽取的16个零件的尺寸:

9.95

10.12

9.96

9.96

10.01

9.92

9.98

10.04

10.26

9.91

10.13

10.02

9.22

10.04

10.05

9.95

经计算得

,

,其中xi为抽取的第i个零件的尺寸,

.

用样本平均数

作为μ的估计值

,用样本标准差s作为σ的估计值

,利用估计值判断是否需对当天的生产过程进行检查?剔除

之外的数据,用剩下的数据估计μ和σ(精确到0.01).

附:若随机变量Z服从正态分布

,则

,

,

.

(1)

,

(2)(ⅰ)见详解;(ⅱ)需要.

,

【答案】(1)

,

(2)(ⅰ)见详解;(ⅱ)需要.

,

【解析】

(1)抽取的一个零件的尺寸在

之内的概率为0.9974,

从而零件的尺寸在

之外的概率为0.0026,

.

因此

.

的数学期望为

.

(2)(i)如果生产状态正常,

一个零件尺寸在

之外的概率只有0.0026,

一天内抽取的16个零件中,出现尺寸在

之外的零件

概率只有0.0408,发生的概率很小.

因此一旦发生这种情况,就有理由认为这条生产线在这一天的生产过程

可能出现了异常情况,需对当天的生产过程进行检查,

可见上述监控生产过程的方法是合理的.

(ii)由

,

的估计值为

,

的估计值为

,

由样本数据可以看出有一个零件的尺寸在

之外,

因此需对当天的生产过程进行检查.

剔除

之外的数据

,

剩下数据的平均数为

,

因此

的估计值为

.

,

剔除

之外的数据

,

剩下数据的样本方差为

,

因此

的估计值为

.

【点评】从总体中取的

个零件虽然属于不放回抽样,但亦不可能用超几何分布进行计算,而应该看成是有放回抽样,把“取的

个零件”理解成做

次独立重复试验,这

次试验中,数据落在

之外的次数“

"有

种可能的结果.用样本频率估计总体分布,用总体分布估计样本频率,因此,要明确用什么估计什么?不能含糊不清,关系不明,本题第(1 )问显然是用数据总体落在

之外的频率,估计从总体中任取一个个体,其数据落在

之外的概率.概率在生产实践中有何运用?怎样通过概率进行决策分析?如何在频率分布直方图或正态分布曲线中求事件发生的“频率”呢?在“频率分布直方图”中,某一范围内(如:

)数据出现的频率是该范围内对应的直方图矩形面积之和,正态分布曲线中该范围的面积是正态曲线下横轴上一定区间的面积,或变量值落在该区间的概率(概率分布).

概率统计中正态分布的运用

1、正态分布的定义及表示

如果对于任何实数

,随机变量X满足

(即x=a,x=b,正态曲线及x轴围成的曲边梯形的面积),则称随机变量X服从正态分布,记作

.(其中实数

为参数,分别表示总体的数学期望(均值)与标准差,

的图象称为正态分布密度曲线,又称总体密度曲线或概率密度曲线,,简称正态曲线)

2、正态分布的三个常用数据

;

;

.

(注)若

,则

,可以看到,正态总体几乎总取值于区间

之内.而在此区间以外取值的概率只有

,通常认为这种情况在一次试验中几乎不可能发生.在实际应用中,通常认为服从于正态分布

的随机变量

只取

之间的值,并简称之为

原则.

1.正态分布类型

类型1、 正态分布的概念与性质

①曲线位于

轴上方,与

轴不相交;

②曲线是单峰的,它关于直线

对称;

③曲线在

处达到峰值

;

④曲线与x轴之间的面积为

;

⑤当

一定时,曲线的位置由

确定,曲线随着

的变化而沿

轴平移,如图甲所示.

⑥当

一定时,曲线的形状由

确定,

越小,曲线越“瘦高”,表示总体的分布越集中;

越大,曲线越“矮胖”,表示总体的分布越分散,如图乙所示.

类型2、求正态分布在某一区间内取值的概率

计算概率的几个常用公式

;

;

④若

,则

.

类型3、正态分布的实际应用

(1)假设统计变量服从正态分布

.

(2)确定一次试验中取值

是否落在区间

内.

(3)做出判断:若

,则接受统计假设;若

,则拒绝统计假设.

2.解题步骤

数(正态分布)→形(正态曲线)→形(对称性)→数(对获取的对形的认识作出代数解释).

1:

(2020全国高三专题练习)如图分别是甲、乙、丙三种品牌手表日走时误差分布的正态分布密度曲线,则下列说法不正确的是( )

:

A:三种品牌的手表日走时误差的均值相等:

B:三种品牌的手表日走时误差的均值从大到小依次为甲、乙、丙:

C:三种品牌的手表日走时误差的方差从小到大依次为甲、乙、丙:

D:三种品牌手表中甲品牌的质量最好:

2:(2020六安市城南中学高三月考(理))六安市一次高三年数学统考,经过抽样分析,成绩

近似服从正态分布

,且

.某校有800人参加此次统考,估计该校数学成绩不低于

分的人数为__________.数据参考:若

服从正态分布

则,

,

,

:

3:

(湖南株洲市高三上学期期末)

年国庆节期间,我国高速公路继续执行“节假日高速公路免费政策”.某路桥公司为掌握国庆节期间车辆出行的高峰情况,在某高速公路收费站点记录了

日上午

这一时间段内通过的车辆数,统计发现这一时间段内共有

辆车通过该收费站点,它们通过该收费站点的时刻的频率分布直方图如下图所示,其中时间段

记作

记作

,

记作

,

记作

,例如:

分,记作时刻

.

(Ⅰ)估计这

辆车在

时间内通过该收费站点的时刻的平均值(同一组中的数据用该组区间的中点值代表);

(Ⅱ)为了对数据进行分析,现采用分层抽样的方法从这

辆车中抽取

辆,再从这

辆车随机抽取

辆,设抽到的

辆车中,在

之间通过的车辆数为

,求

的分布列;

(Ⅲ)根据大数据分析,车辆在每天通过该收费站点的时刻

服从正态分布

,其中

可用

日数据中的

辆车在

之间通过该收费站点的时刻的平均值近似代替,

用样本的方差近似代替(同一组中的数据用该组区间的中点值代表).假如

日全天共有

辆车通过该收费站点,估计在

之间通过的车辆数(结果保留到整数).

附:若随机变量T服从正态分布

,则

,

,

.

:

(0)

相关推荐