很多人都犯了类似的错误,线性思维的三个陷阱,值得警惕

第三个:线性模型

在所有的模型中,可能线性模式是最简单,而且应用最广泛的。简单的理解就是一个变量的变化导致了另外一个变量的变化。比如教育对收入的影响,锻炼对健康的影响,房屋面积对房屋价值的影响,跑步的时间对跑步的距离的影响,都可以用线性模型来解释。

但在几乎所有的现实生活中,都不是严格按照线性模型发展变化的。线性模型应用最广的就是预测,因为线性的变化预测是最简单的。在线性思维中,我们需要注意三个错觉。

首先,“线性”是有边界的

在线性模型中,最简单的就是直线模型,比如100平米的房子售价100万,那么200平米的房子,就售价200万,是等比增加的。但大多数情况,线性模型的预测是有效用边界的,比如一个人1小时可以跑5公里,那么我们不能依此推测,他跑10小时就能跑50公里,因为很少人能连续跑10小时。所以我们在进行线性思维推理和预测的时候,要考虑线性思维的边界或者作用范围。

其次,“多元线性”思维

在现实生活中,线性模型往往不是“一元”线性,而是“多元”的线性,也就是影响的变量不只是一个,比如每个人的幸福指数,就和婚姻美满、身体健康、收入情况等多个变量相关,所以用简单的“一元线性模型”就无法解释。而且,在多元线性模型中,运气还是一个非常重要的因素,比如在人生职业发展、体育比赛等上面,往往成功都是实力+运气的结果,所以,在预测这样复杂的情况时,我们需要考虑到“回归均值”,什么意思呢?

比如一家休闲汽车销售公司的经理发现,用销售数量来衡量的成功有很大的运气成分,按照回归均值的思维,那么本月取得了很好业绩的销售人员,下个月可能会回到平均水平。然后,这个经理就可以利用这个模型来指导行动了。比如,他不会为了争取一个连续两个月都取得非常不错业绩的销售人员,而付出比竞争对手高很多的薪资,因为连续两个月取得好成绩,可能是因为运气的缘故。

相反,如果在某一个领域,运气对成功几乎没有任何作用,那么连续两个月的业绩就可以作为未来业绩表现的一个很好的预测器。在这种情况下,经理就应该为这个最佳销售人员提供有竞争力的报酬。

第三,相关和因果的混淆

我们通过大数据的分析可能发现,很多数据都存在线性的相关性,比如统计发现,学生的学习考试成绩,和他当天的走路步数呈线性关系,比如某个大学的学术表现和参加马术队的学生人数呈线性关系。但是,显然考试成绩和步数,马术队与学术水平之间,可能并不存在直接的因果关系。

所以,实际上,我们通过数据挖掘很发现导致虚假的相关关系,也就是说,这两个变量只是偶然相关。我们可能会发现,名字较长的公司可以获得更高的利润,或者居住在比萨店附近的人更容易患流感等等。事实上,使用5%的显著性水平阈值,每检验20个变量就会发现有一个是显著的虚假相关性。因此,如果尝试足够的变量,肯定会发现某些显著但虚假的相关性。

虽然现实生活中,绝大部分情况都并非满足精确的线性模型,但是线性模型思维是我们思维的一个很好的起点,至少可以用线性模型来检验我们的直觉判断。

(0)

相关推荐