《多元回归分析》实验报告
第一次实验
《应用回归分析》第二章作业答案(何晓群版)2.15 一家保险公司十分关心其总公司营业部加班的程度,决定认真调查一下现状。经过十周时间,收集了每周加班时间的数据和签发的新保单数目,x为每周签发的新保单数目,y为每周加班时间(小时)。周序号12345678910x825215107055048092013503256701215y3.51.04.02.01.03.04.51.53.05.0(1) 画出散点图。
(2) X与Y之间是否存在大致呈线性关系?
得到的=0.9,拟合效果较好,所以是大致呈线性关系。(3) 用最小二乘估计求出回归方程。
可以得到的回归方程为:y=0.004x + 0.118。(4) 求出回归标准误差。
由方差分析表可以得到回归标准误差:SSE=1.843,所以回归标准差误差为:SSE/2=0.48回归标准误差为0.4800。(5) 给出置信度为95%的区间估计。
可以得到的区间估计为:[-0.701,0,937] 与 [0.003,0.005](6) 计算X与Y的决定系数。
从表中可以看到,决定系数为0.9,说明模型的拟合度较高。(7) 对回归方程做方差分析.
方差分析中可以得到:F值=72.396>5.32[F(1,8)=5.32]。(8) 做回归系数的显著性检验。由方差分析表中显著性约为0,所以拒绝原假设,说明回归方程显著(9) 做相关系数的显著性检验。
因为模型的相关系数达到0.949,说明x与y显著性相关。(10) 对回归方程做残差图并做相应的分析。
从残差图上可以发现残差就是围绕e=0上下波动,满足模型的看基本假设。(11) 该公司预计下一周签发新保单=1000张,需要的加班时间是多少?
y =0.118+0.00359*1000=3.7032。所以需要加班时间为3.7032.(12) 给出的置信度为95%的精确预测区间和预测区间。
得到精确预测区间为[-0.701,0.937]和预测区间为[0.003,0.005]。(13) 给出E的置信度为95%的区间估计。
则根据数据结果显示,区间估计为[2.51949,4.8870