HR分析技术--回归分析

回归分析是最常用的数据分析模型之一,我们将通过一些实际例子来解释回归分析的工作原理。

最小二乘法

要理解这一点,你需要了解最小二乘法的概念,最小二乘法是一种减少曲线与其数据点之间距离的技术,如下例所示:

张三在他20岁时在一张纸上记录了他的工资——他每 5 年上涨一次,这就是 20 年后张三工资图的样子:

在这个简单的散点图中,你可以看到张三在 20 岁时赚了2500 元,而在40 岁时,他赚了4700 元。

当40岁的张三想要预测到他45岁时他能挣多少钱时,最简单的方法是画一条穿过他图表中第一个和最后一个点的线,如下所示:

这条线似乎符合模型,并且可以让张三粗略估计他在45岁时能赚多少钱。

最小二乘法计算所有数据点之间的平方距离。例如,张三估计钱与 25、30 和 35 岁的数据点略有不同,分别相差230元、120元和380元(蓝色箭头)。为了找到最小平方,你需要计算平方和这行:

230 ²+120 ² + 380 ²= 211700

下一个目标是找到最小平方。通过拟合更接近五个数据点的线,平方和将更低,回归线将具有更好的拟合。事实上,最好的拟合是192,000的平方和。通过使用 SPSS、R 或 Excel 等软件,我们可以进行此估计并生成最适合数据的线。该线如下所示:

在此模型中,单个数据点与线之间的距离处于最低点。换句话说:这条线有最小二乘法。

线性回归分析

在前面的示例中,我们使用最小二乘法创建了一条线性曲线,该技术是线性回归中最常用的技术。

回归是两个变量之间关系的度量。我们在张三的示例中使用了线性曲线(一条线),因此是线性回归。

使用这条回归线,我们可以估计我们期望张三在给定年龄赚多少钱,张三的回归线具有以下公式:

薪酬= 320 + 112 * 年龄

换句话说,当张三20 岁时,回归公式将估计他将获得:

320+ 112 * 20 = 2,560 元

这与他 2,500 元的实际收入非常接近!在 45 岁时,张三大约可以赚取 5,360 元。

注意:回归曲线并不总是线性的,你还可以应用指数线、对数线或其他类型的线来拟合你的数据。

逐步回归分析

在我们之前的回归分析中,我们仅使用“年龄”变量来解释薪酬的增加,逐步回归是一种通过将多个不同的变量逐一添加来构建回归模型的技术。

当添加一个新变量时,你会期望模型的解释力会增加。如果没有发生这种情况,变量不会增加更多的解释力,因此可以省略。

应用逐步回归的技术有多种,但我们将专注于最简单的形式:简单的逐步回归。

逐步回归在 Excel 中已经很难做到了,R 或SPSS 等工具对于这种技术更为实用。

当然,还有比我在本文中写的更多的方法,但我相信了解分析技术的基础知识将帮助你了解数据驱动的人员分析的力量和潜力。

最后,我们来看一个薪酬回归分析的视频:

(0)

相关推荐