Excel应用大全 | 什么是回归线

一本书教会你分分钟搞定数据分析!
回归是一种统计方法,这种方法可以用来建立数学模型,从而根据一个或多个变量来预测另一个变量的值。回归分析的本质是如何确定两个或多个变量之间的相关关系,并依据估计结论做推测的过程。

估计的概念

估计是基于已有数据集(如含有两个变量X和Y的数据集,其中X是自变量,Y是因变量),计算X和Y之间的相关性(求出相关系数r),然后用已知的X数据和r估计Y。例如,收集1000个成年人的身高和体重数据,计算出身高和体重之间的相关系数,再取新的若干个成年人的身高,使用估计方法可以估计每个人的体重,这就是估计的基本流程。在这个过程中,用到的估计方法称为线性回归。

用最小二乘法确定回归线

设身高为X,体重为Y,则(xi,yi)是成年人i的身高和体重,用样本数据绘制的散点图如图12-1所示,在该图中身高和体重具有一定程度的正相关属性,为这个杂乱的散点图拟合一条适当的直线,即回归线。
图 12-1 身高体重散点图
为了说明一条直线的拟合过程,在此先简化数据集,只保留10个点的数据,具体数值如表12-1所示。
表 12-1 缩减到 10 个数据
根据以上数据绘制的散点图如图12-2所示。
图 12-2 缩减后的数据
如果数据点较少并且相关性很强,几乎可以通过目测来画一条接近所有数据点的直线,从而看出趋势。但是在图12-2所展示的数据中,很难用目测的方式得到一条直线来估计和每一个数据点的距离。尝试几条直线,都只能得到近似结果,如图12-3所示。
图 12-3 “目测”方法得到多条近似拟合直线
实际上只有一条直线能最佳地拟合数据趋势,所有数据点距离该直线的垂直方向距离的平方和最小,这和计算方差、相关系数的逻辑相同,都是计算某一个标准的距离平方和的最小值。
每个数据点都有一个垂直于X轴的到拟合线的距离,如图12-4所示。

图 12-4 数据点与拟合线的垂直方向的距离

如果某一条拟合线距离所有数据点的距离平方和最小,那么这条拟合线就是最优拟合线,也称为回归线。
以上用“最小距离”寻找回归线的方法即是最小二乘法。用最小二乘法找到的回归线,其实际意义是,尽量减少估计值相对于实际值的总变动。从回归线中,可以得到以下结论。
1. 这是变量 Y 对 X 的回归,也就是说 Y(体重)将依据 X(身高)的值被估计出来。
2. 这条回归线可以进行比较准确的预测。例如,如果身高是 180cm,那么体重大概是 78kg。
3. 每一个数据点和回归线的距离就是估计误差,是两个变量之间相关的直接反映,如果是完全估计,所有估计的数据刚好落在回归线上,从这个意义上讲,回归线也是最小误差平方和的直线。

给定回归线之后,可以估计所有的未来值,这正是回归分析的目的,建立回归线然后进行估计。

在 Excel 中生成回归线

在Excel中按照如下步骤操作添加生成回归线。
步骤1:单击选中散点图图表,单击【图表元素】按钮,在弹出的【图表元素】快捷菜单中选中【趋势线】复选框。
步骤2:单击【趋势线】复选框右侧的展开按钮,在弹出的快捷菜单中选择【线性】选项,如图12-5所示。

图 12-5 生成回归线

知道什么是回归线了吗?
(0)

相关推荐

  • 2.3变量间的相关关系

    我的工作总是力图把真与美结合起来,但是,当我不得不选择其中的一种时,我通常选择美.--韦尔 2.3变量间的相关关系 一.要背的概念和公式: 1.区分清楚相关关系与函数关系: 2.根据散点图,分清正相关 ...

  • 《R数据可视化手册》之—善变的散点图

    作者:文艺 审核:文涛 <R数据可视化手册>之--善变的散点图 写在前面 散点图是文献中常见的可视化图形,同时也是基本可视化方式之一,在R语言中得到很好的支持,尤其是ggplot2.本小结 ...

  • 应该掌握的7种回归模型

    本文转载自博客你应该掌握的7种回归模型!. 线性回归和逻辑回归通常是人们学习预测模型的第一个算法.由于这二者的知名度很大,许多分析人员以为它们就是回归的唯一形式了.而了解更多的学者会知道它们是所有回归 ...

  • Excel应用大全 | 单纯随机抽样

    一本书教会你分分钟搞定数据分析! 在数据分析中,抽样是指从全部数据中选择部分数据进行分析,以发掘更大规模数据集中的有用信息.在收集数据过程中,绝大多数情况下,并不采取普查的方式获取总体中所有样本的数据 ...

  • 实用Excel快捷键大全

    光明网2月23日 · 光明网官方账号 来源: 宁波发布

  • Excel快捷键大全

    Excel快捷键大全

  • 最强Excel快捷键大全,需要时查一查!说起Excel,可能所有人都知道这是一个office软件,但...

    说起Excel,可能所有人都知道这是一个office软件,但很少有人知道,这个名字其实源自英语中的"Excellence"一词,代表着:卓越和优秀. 感感顾名思义,设计者对这款软件 ...

  • Excel应用大全 | 二维表转换一维表

    一本书教会你分分钟搞定数据分析! 常见的二维表是一种交叉表,有行.列两个方向的标题交叉定义数据的属性.二维表在工作和生活中应用十分广泛,如课程表.工资表.人员花名册.价格表等.一维表则是每一行都是完整 ...

  • Excel应用大全 | PDF中的数据如何导出

    一本书教会你分分钟搞定数据分析! PDF(便携式文档格式,其全称为Portable Document Format)是由Adobe Systems公司开发设计的一种支持跨平台使用可移植的电子文件格式. ...

  • Excel应用大全 | 动手创建第一个数据透视表

    一本书教会你分分钟搞定数据分析! 图 6-1 展示了某鞋服零售公司在某时期内各零售商店的销售和成本明细数据,现在需要总结各店的综合销售情况.如果是 Excel 初学者遇到这上万行的数据,通常的做法可能 ...

  • 神级Excel函数大全:对手残党来说好用哭了,全部都是“高能”

    财务人之前在日常工作中多多少少都会用到财务函数公式,但是很多财务人对于一些常用的函数公式都不会,有的乱学一通还没有多少有用的,神级Excel函数大全:对手残党来说好用哭了,全部都是"高能&q ...

  • 纯干货, Excel快捷键大全,职场...

    纯干货, Excel快捷键大全,职场小白变大神 不管是在学习还是工中,Excel都会经常用到的,会这些快捷键,可以快递提升工作和学习效率,简单易上手,大家快用起来吧.#Excel# #Excel快捷键 ...