概率统计专题46:理性回归 - 线性回归方程模型
概率统计专题46:理性回归 - 线性回归方程模型
线性回归方程常用来预估某变量的值,因此选择恰当的拟合函数是解题的关键,一般解题要点如下:
(1)作图:依据样本数据画出散点图,确定两个变量具有线性相关关系,往往也会通过计算相关系数来判定拟合的程度.
(2)计算:计算出
,
,
等,计算回归系数
.
(3)求方程:写出线性回归直线方程
.
几个常见的求解题型:
1.判断两个变量是否线性相关及相关程度通常有两种方法:(1)利用散点图直观判断;(2)将相关数据代入相关系数
公式求出
,然后根据
的大小进行判断.求线性回归方程时要严格按照公式求解,并一定要注意计算的准确性.
2.求解线性回归模型
基本步骤:①确定研究对象,明确哪个是解释变量,哪个是预报变量;
②画出确定好的解释变量和预报变量的散点图,观察它们之间的关系(是否存在线性关系);
③由经验确定回归方程的类型(如我们观察到数据呈线性关系,则选用线性回归方程
);
④按照公式计算回归方程中的参数(如最小二乘法),得到线性回归方程;
3.求非线性回归模型
基本步骤:①确定研究对象,明确哪个是解释变量,哪个是预报变量;
②画出确定好的解释变量和预报变量的散点图,观察它们之间的关系(是否存在非线性关系);
③由经验确定非线性回归方程的类型(如我们观察到数据呈非线性关系,一般选用反比例函数、指数函数、对数函数模型等);
④通过换元,将非线性回归方程模型转化为线性回归方程模型;
⑤按照公式计算线性回归方程中的参数(如最小二乘法),得到线性回归方程;
⑥消去新元,得到非线性回归方程;
【2020.湖南省衡阳市高三三模联考】某同学在开展“深入研究销售量与价格的关系,促进商品经济的发展”的社会实践课题研究中,对某件产品在该城市的6个门店中的销售量及其价格进行调查,其单价x和销售量y之间的一组数据如下表所示:
门店编号i |
1 |
2 |
3 |
4 |
5 |
6 |
单价x(元) |
9.5 |
9 |
10 |
11 |
10.5 |
8 |
销售量y(件) |
10 |
11 |
8 |
5 |
6 |
14 |
(1)根据1至5号门店的数据,求出y关于x的回归直线方程;
(2)若由回归直线方程得到的估计数据与剩下的检验数据的误差不超过0.5元,则认为所得到的回归直线方程是理想的,试问所得回归直线方程是否理想?
(3)假设在今后的销售中,销售量与单价仍然服从(1)中的关系,且该产品的成本是2.5元/件,为获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)
参考公式与数据:回归直线方程:
,其中
,
,
【解析】
(1)由1至5号数据知
,
,所以
,
,所以
.
(2)由(1)知,当
时,
,因为
,所以可认为所得到的回归直线方程是理想的.
(3)设该产品的单价为x元,依题意得,利润
(
),所以当
时,L取得最大值,故为获得最大利润,该产品的单价应定为7.5元.
1.(改编)上周某小学六年级学生参加了数学测试,年级组织任课教师对这次考试进行成绩分析现从中随机选取了50名学生的成绩作为样本,已知这50名学生的成绩全部在40分至100分之间,现将成绩按如下方式分成6组:第一组;第二组;……;第六组,并据此绘制了如图所示的频率分布直方图.
(1) 估计这次月考数学成绩的平均分;
(2) 为了研究成绩是否和每天所花在数学上的学习时间有关,从这50名学生中随机抽取了6名学生,统计出这6名学生的成绩分别为40分、62分、70分、75分、83分、96分,已知这6名学生的每天学习数学的时间(分钟)依次为20、30、35、37、40、48,
(ⅰ)根据以上数据,求学生数学成绩y关于每天所花在数学上的学习时间x的线性回归方程(精确到整数);
(ii) 根据(ⅰ)中的回归方程,估计该这50名学生中每天花在数学上的学习时间在30—40分钟的人数(保留整数).
参考公式:由最小二乘法所得回归直线的方程是
;
其中,
,
.
本题参考数据:
,
2.(改编)某科技公司为了对某光盘进行合理定价,需了解该光盘的月销售量
(单位:万张)与月销售单价
(单位:元/张)之间的关系,对一年的月销售量
和月销售单价
得到了下面的散点图.
(1)
与
哪一个更适宜作为月销量
关于月销售价
的回归方程类型?试从相关系数的角度,选择一个拟合程度更好的模型,并求出该模型的回归方程;
(2)利用(1)中的结果回答问题:要使的月销售量为7.6万张,则每张光盘的售价约为多少元?
参考公式、参考数据及说明:
①对一组数据
,
,…,
,相关系数
其回归直线
的斜率和截距的最小二乘法估计分别为
,
.
②参考数据:
表中
,
.
3. 【2020.广东省揭阳市高三下学期3月调研】
某企业为确定下一年投入某种产品的研发费用,需了解年研发费用
(单位:千万元)对年销售量
(单位:千万件)的影响,统计了近10年投入的年研发费用
与年销售量
的数据,得到散点图如图所示.
(1)利用散点图判断
和
(其中
均为大于
的常数)哪一个更适合作为年销售量
和年研发费用
的回归方程类型(只要给出判断即可,不必说明理由)
(2)对数据作出如下处理,令
,得到相关统计量的值如下表:根据第(1)问的判断结果及表中数据,求
关于
的回归方程;
15 |
15 |
28.25 |
56.5 |
(3)已知企业年利润
(单位:千万元)与
的关系为
(其中
),根据第(2)问的结果判断,要使得该企业下一年的年利润最大,预计下一年应投入多少研发费用?
附:对于一组数据
,其回归直线
的斜率和截距的最小二乘估计分别为
,