概率统计专题47:大势所趋 - 正态分布
概率统计专题47:大势所趋 - 正态分布
(
全国I卷理)为了监控某种零件的一条生产线的生产过程,检验员每天从该生产线上随机抽取16个零件,并测量其尺寸(单位:cm).根据长期生产经验,可以认为这条生产线正常状态下生产的零件的尺寸服从正态分布
.
(1)假设生产状态正常,记X表示一天内抽取的16个零件中其尺寸在
之外的零件数,求
及X的数学期望;
(2)一天内抽检零件中,如果出现了尺寸在
之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.
(ⅰ)试说明上述监控生产过程方法的合理性;
(ⅱ)下面是检验员在一天内抽取的16个零件的尺寸:
9.95 |
10.12 |
9.96 |
9.96 |
10.01 |
9.92 |
9.98 |
10.04 |
10.26 |
9.91 |
10.13 |
10.02 |
9.22 |
10.04 |
10.05 |
9.95 |
经计算得
,
,其中xi为抽取的第i个零件的尺寸,
.
用样本平均数
作为μ的估计值
,用样本标准差s作为σ的估计值
,利用估计值判断是否需对当天的生产过程进行检查?剔除
之外的数据,用剩下的数据估计μ和σ(精确到0.01).
附:若随机变量Z服从正态分布
,则
,
,
.
(1)
,
(2)(ⅰ)见详解;(ⅱ)需要.
,
【答案】(1)
,
(2)(ⅰ)见详解;(ⅱ)需要.
,
【解析】
(1)抽取的一个零件的尺寸在
之内的概率为0.9974,
从而零件的尺寸在
之外的概率为0.0026,
故
.
因此
.
的数学期望为
.
(2)(i)如果生产状态正常,
一个零件尺寸在
之外的概率只有0.0026,
一天内抽取的16个零件中,出现尺寸在
之外的零件
概率只有0.0408,发生的概率很小.
因此一旦发生这种情况,就有理由认为这条生产线在这一天的生产过程
可能出现了异常情况,需对当天的生产过程进行检查,
可见上述监控生产过程的方法是合理的.
(ii)由
,
得
的估计值为
,
的估计值为
,
由样本数据可以看出有一个零件的尺寸在
之外,
因此需对当天的生产过程进行检查.
剔除
之外的数据
,
剩下数据的平均数为
,
因此
的估计值为
.
,
剔除
之外的数据
,
剩下数据的样本方差为
,
因此
的估计值为
.
【点评】从总体中取的
个零件虽然属于不放回抽样,但亦不可能用超几何分布进行计算,而应该看成是有放回抽样,把“取的
个零件”理解成做
次独立重复试验,这
次试验中,数据落在
之外的次数“
"有
共
种可能的结果.用样本频率估计总体分布,用总体分布估计样本频率,因此,要明确用什么估计什么?不能含糊不清,关系不明,本题第(1 )问显然是用数据总体落在
之外的频率,估计从总体中任取一个个体,其数据落在
之外的概率.概率在生产实践中有何运用?怎样通过概率进行决策分析?如何在频率分布直方图或正态分布曲线中求事件发生的“频率”呢?在“频率分布直方图”中,某一范围内(如:
)数据出现的频率是该范围内对应的直方图矩形面积之和,正态分布曲线中该范围的面积是正态曲线下横轴上一定区间的面积,或变量值落在该区间的概率(概率分布).
概率统计中正态分布的运用
1、正态分布的定义及表示
如果对于任何实数
,随机变量X满足
(即x=a,x=b,正态曲线及x轴围成的曲边梯形的面积),则称随机变量X服从正态分布,记作
.(其中实数
和
为参数,分别表示总体的数学期望(均值)与标准差,
的图象称为正态分布密度曲线,又称总体密度曲线或概率密度曲线,,简称正态曲线)
2、正态分布的三个常用数据
①
;
②
;
③
.
(注)若
,则
,可以看到,正态总体几乎总取值于区间
之内.而在此区间以外取值的概率只有
,通常认为这种情况在一次试验中几乎不可能发生.在实际应用中,通常认为服从于正态分布
的随机变量
只取
之间的值,并简称之为
原则.
1.正态分布类型
类型1、 正态分布的概念与性质
①曲线位于
轴上方,与
轴不相交;
②曲线是单峰的,它关于直线
对称;
③曲线在
处达到峰值
;
④曲线与x轴之间的面积为
;
⑤当
一定时,曲线的位置由
确定,曲线随着
的变化而沿
轴平移,如图甲所示.
⑥当
一定时,曲线的形状由
确定,
越小,曲线越“瘦高”,表示总体的分布越集中;
越大,曲线越“矮胖”,表示总体的分布越分散,如图乙所示.
类型2、求正态分布在某一区间内取值的概率
计算概率的几个常用公式
①
②
;
③
;
④若
,则
.
类型3、正态分布的实际应用
(1)假设统计变量服从正态分布
.
(2)确定一次试验中取值
是否落在区间
内.
(3)做出判断:若
,则接受统计假设;若
,则拒绝统计假设.
2.解题步骤
数(正态分布)→形(正态曲线)→形(对称性)→数(对获取的对形的认识作出代数解释).
1:
(2020全国高三专题练习)如图分别是甲、乙、丙三种品牌手表日走时误差分布的正态分布密度曲线,则下列说法不正确的是( )
:
A:三种品牌的手表日走时误差的均值相等:
B:三种品牌的手表日走时误差的均值从大到小依次为甲、乙、丙:
C:三种品牌的手表日走时误差的方差从小到大依次为甲、乙、丙:
D:三种品牌手表中甲品牌的质量最好:
2:(2020六安市城南中学高三月考(理))六安市一次高三年数学统考,经过抽样分析,成绩
近似服从正态分布
,且
.某校有800人参加此次统考,估计该校数学成绩不低于
分的人数为__________.数据参考:若
服从正态分布
则,
,
,
:
3:
(湖南株洲市高三上学期期末)
年国庆节期间,我国高速公路继续执行“节假日高速公路免费政策”.某路桥公司为掌握国庆节期间车辆出行的高峰情况,在某高速公路收费站点记录了
日上午
这一时间段内通过的车辆数,统计发现这一时间段内共有
辆车通过该收费站点,它们通过该收费站点的时刻的频率分布直方图如下图所示,其中时间段
记作
、
记作
,
记作
,
记作
,例如:
点
分,记作时刻
.
(Ⅰ)估计这
辆车在
时间内通过该收费站点的时刻的平均值(同一组中的数据用该组区间的中点值代表);
(Ⅱ)为了对数据进行分析,现采用分层抽样的方法从这
辆车中抽取
辆,再从这
辆车随机抽取
辆,设抽到的
辆车中,在
之间通过的车辆数为
,求
的分布列;
(Ⅲ)根据大数据分析,车辆在每天通过该收费站点的时刻
服从正态分布
,其中
可用
日数据中的
辆车在
之间通过该收费站点的时刻的平均值近似代替,
用样本的方差近似代替(同一组中的数据用该组区间的中点值代表).假如
日全天共有
辆车通过该收费站点,估计在
之间通过的车辆数(结果保留到整数).
附:若随机变量T服从正态分布
,则
,
,
.
: