【数据分析思维】数据分析中预测分析应该怎么做? | 人人都是产品经理
编辑导语:在各行业各领域,只要有核心的业务指标,都要预测核心业绩未来的走势,销售,市场营销,运营,财务等。一方面可以对未来的发展趋势有个大致的掌握,另一方面也可以提前规划,设定各下属部门的KPI,以便尽可能地完成或者超过KPI。所以,数据分析师作为公司业务的策略官,掌握正确的预测方法,无疑是非常重要的,今天就带大家一起来看看,我们究竟怎么做预测?
01 为什么预测很重要?
每逢年末年初,除了对上一年的整体业绩做复盘和总结外,老板最关心的一件事莫过于:“下一年的销售额预测是多少?”这个问题看似很简单,但却让下属主管们挠秃了头,因为这个预测不是拍拍脑袋就敲定,说高了,顺势就给自己挖了个坑,说低了,老板就会diss你没有了解业务现状。
可是预测到底该怎么做呢?看到那么复杂的数据,肯定要用很高端的工具才可以吧?Python还是SPSS呢?我都不会啊啊!!!
其实我们可以用Excel,是的,没有听错,就用我们平时觉得很low的Excel就能完成那么高大上的操作,无需任何统计和编程知识,简单妥妥拽拽,预测就完成了,下面我们就以一个实际案例开始我们的Excel的预测之旅吧!
在本文中,我们将对一家老牌的甜品店进行非常有趣的案例研究。我们有以往年月的销售量数据,将预测2020年剩余月份的销售量。
正如在前面所提到的,预测是数据分析师最基本的技术之一,可以帮助公司预测未来的业绩趋势和机会。大型公司和初创公司都会依赖预测来做出关键的决定。例如:
使用预测来预测产品、服务的用户量,并在合适的时间点进行运营
使用预测来预测销售并相应地计划预算,制定KPI等
使用预测来预测人力成本,并因此建议未来的招聘计划
其他
这些是数据分析师在实际工作中会经常遇到的预测案例。如果你打算成为一名数据分析师,一定要学会预测分析。
02 什么是预测?
什么是预测?
用最简单的术语来说,它是在分析过去和现在的数据,进而预测未来的过程。我们主要根据时间序列数据进行定量预测。因此,在开始之前,我们先了解一些关键的时间序列术语。
时间序列通常是随时间推移而收集的数据,并且取决于时间变量。例如,这里有一个每年飞行的乘客数量的时间序列数据:
时间序列数据中包含了一些重要的组成部分,我们需要将这些组成部分拆解:
趋势性:趋势是事物发展或变化的总体方向。在上面的例子中,我们看到时间序列呈增长趋势,这意味着在飞机上飞行的乘客数量整体趋势上是在增加。如下图中第二张图所示。
季节性:在上述时间序列中可以看到的另一个清晰的模式,就是该模式以固定的时间周期重复,我们称为季节性。在特定时间周期内重复出现或重复的时间序列中任何可预测的变化或模式都可以说是季节性。下图中第三张图所示。
随机性:去除趋势性和季节性后,剩下的就是一些随机的、无任何规律的白噪声。下图中第四张图所示。
03 用Excel内置函数进行预测
内置函数介绍
我们将从Excel中可用的最简单的函数开始:
Forecast.linear()
它通过使用现有或过去的值来预测或计算值。我们将通过自变量x值来预测y,是基于线性回归函数进行预测。
如果数据中存在线性趋势(即y线性依赖于x值),则此函数的效果最佳,但有一点需要注意,如果数据中存在明显的季节性,那么该函数就不再适用了。
那么对于有季节性的数据,我们该怎么预测呢?不用担心,Excel为我们提供了另一个强大的高级预测功能:
Forecast.ets()
此函数通过三重指数平滑方法进行此预测。这里不会深入介绍指数平滑方法,但该函数的使用需要注意一些点:
Forecast.ets函数或三重指数平滑方法考虑了季节性
此方法是加权方法,越久远的值,权重越小,也就意味着,重要性越小
最重要的是,时间轴必须均匀分布,否则会产生错误。例如,它们可以是每月数据,每日数据,年度数据等。
Forecasting.ets.seasonality()
它返回基于历史数据检测到的季节性周期的长度,如有的数据是5个月重复一次,那么它的周期就是5。
Forecasting.ets.confint()
它返回指定目标日期的预测值的置信区间。默认的置信区间为95%。这意味着95%的预测值将在该值的范围内。
单纯的理解这些函数可能有些费力,所以我们从一个实际案例看看怎么一步步跑起来。
使用内置函数预测
下面就是本文中最令人期待的部分了。我们有一个甜点店的数据集,它包含从2018年1月到2020年8月的每月销售数据。我们将预测在2020年剩余月份的销售情况,以便店主可以相应地准备库存和工作人员。
这是示例数据:
我们将预测4个月的销售额:9月,10月,11月,12月
需要注意的是,使用的Excel版本必须是2016以后的版本。
基于Forecast.ets函数进行预测
同时,也可以使用Forecasting.ets.seasonality和Forecasting.ets.confint检查季节性和置信区间。
04 用Excel预测模型进行预测
在Excel 2016及更高版本中进行预测可以更加直观和方便。我们可以直接使用预测模型执行这些步骤。
步骤1 –选择预测表
转到数据,然后选择预测表:
步骤2 –选择必要的选项
然后,您可以选择必要的选项,例如:结束日期,置信区间,并执行更多自定义。预测表为我们提供了表格值,例如预测,下置信度值和上置信度值以及数据的图形视图:
拖拖拽拽,连函数都不用输入,你已经在Excel中建立了第一个预测模型!很简单,是不是?
我们来看一下我们的预测结果:
通过查看我们的数据,我们注意到通常在十一月和附近月份会出现高峰,这可能是由于节日的原因。
受新冠疫情的影响,到4月和5月,这家商店的收益为零!太难了!在接下来的7月和8月,销售量有所回升。
我们的预测表明,这种趋势将在9月份继续增长。现在,商店可以查看未来几个月的预测数据以准备库存。他们还可以查看置信度,并了解波动的情况。
05 总结
预测很复杂,因为预测涉及到很多业务。预测又很重要,因为它关乎后续业绩的发展和政策的制定,同时,预测也很简单,简单到用Excel拖拉拽就能轻易实现。本文介绍了用Excel进行预测分析的具体方法,希望这种简单易操作的方法能够帮助到大家。
本文由 @数据分析星球 原创发布于人人都是产品经理。
题图来自 Pexels,基于CC0协议