数据分析的理念、流程、方法、工具
本文将对数据分析的关键知识模块做介绍,可以为你解答以下问题:
为什么要做数据分析?
数据如何驱动运营?
数据分析的指标有哪些?
数据分析的模型有哪些?
怎么评估用户价值?
数据分析报告怎么写?
数据可视化工具 ...
一、数据的价值
(一) 数据驱动企业运营
从电商平台的「猜你喜欢」到音乐平台的「心动模式」,大数据已经渗透到了我们生活的每一个场景。不论是互联网行业,还是零售业、制造业等,各行各业都在依托互联网大数据(数据采集、数据存储、数据处理、数据挖掘、数据分析、数据呈现)实现企业价值。
企业中数据从产生到应用依次要经过数据源层、数据仓库层、数据建模层,最后到数据应用层,经过层层加工逐渐支持到上游的应用环节。
数据应用层是数据产生价值的出口,通过数据挖掘、用户画像建模、推荐算法的制定,可实现千人千面的个性化内容推荐。「个性化」内涵是内容与用户的高度匹配,以达到提升体验、提升高黏性、促进销售转化的目的。
(二)数据驱动产品运营
数据分析对业务发展、产品优化、精细化运营也起到了关键支持。
数据驱动产品、数据驱动运营的关键在于「可以通过数据分析提出产品优化思路,提出运营提升的举措,快速上线验证效果,重新优化,进入新的增长循环」。
数据运营的关键应用场景有:
- 评估产品改版(新功能)效果
- 发现产品改进关键点
- 构建用户画像,以便开展精细化运营
- 优化用户体验
- 发现业务运营中存在的问题
- 运营效果分析、ROI分析
- 数据总结与向上汇报
......
二、如何用数据驱动运营
(一)数据驱动运营的内涵
数据驱动运营是一个很宽泛的概念,但拆分下来,数据驱动运营有三个内涵:
- 产品运营人员要具备数据意识,通过数据发现问题
- 产品运营人员可以通过数据管理本职工作,用数据解决问题
- 让数据说话,提高各部门的沟通效率
(二)数据驱动运营的工作流程
1. 定义数据分析目标
明确目标,意味着运营人员(或数据分析师)要站在数据结果输出对象的角度去思考。
对于管理层来说,往往会关注以下几个结果:
- 重大决策最终反应在了哪些指标上
- 这些指标有什么关联
- 业务全局有什么变化趋势
- 与过去相比,哪些进步了,哪些退步了
- 数据暴露出了什么问题,需要做什么调整
产品运营人员则更关注细节。整体来看,运营数据分析的目标主要有三类——即「解决是什么、为什么、做什么」的问题,具体的数据分析目标还要结合实际工作来定义:
- 是什么:如运营举措的效果如何?产品优化的效果如何?用户使用情况是怎样的?用户的体验反馈如何?
- 为什么:如转化率为什么提升/降低?用户为什么会产生意料之外的行为?运营举措和产品优化为什么有效/没有效果?
- 做什么:如运营策略该如何调整?产品该怎么优化?业务战略该怎么调整?
2. 数据指标拆解
在确定了分析目标后,就需要进行数据指标拆解。明确要分析哪些具体的数据指标,为了避免遗漏关键细节,可以先对业务(或某一个活动、使用场景)流程做梳理,得出每一个节点的数据指标项,根据分析目标需要,保留关键项,剔除多余项。
3. 数据采集
- 定义数据源:在分析数据之前,要对数据来源、统计口径、统计周期加以定义,以便提交「数据提取」需求。
- 数据的获取途径:数据来源包括埋点数据、运营平台、业务平台、第三方平台、回访调研等。运营人员要对不同数据源的真实性、准确性做把关。
4. 数据可视化
使用图表工具,将数据可视化,更容易发现数据的趋势、极值、联系。不同图表类型适用于不同的分析场景。
散点图:用于描述数据之间的规律
折线图:描述数据随着时间变化的趋势
面积图:折线图的延伸,更注重数据和时间趋势的变化关系
柱形图:类别之间的关系
饼状图:数据之间的占比
漏斗图:转化率分析、占比分析
雷达图:个体数据的属性和可视化,常用于用户画像、CRM
树形图:适合数据量大、类别多的情况,比如各类电商的SKU
桑基图:解释数据复杂变化的趋势,一对多或者多对一
热力图:属性和维度的规律组合,有点像折线图
关系图:不同种类的关系,常用于社交媒体
箱线图:统计学图表,用于研究和观察数据分布,对比数据分布等
标靶图:用于业务销售完成情况等
词云图:文本分析利器
地理图:数据和空间的关系
5. 数据分析
解决问题是数据分析的最终落脚点。这一环节的目标是发现数据的特征、规律、数据之间的关联,通过对数据的洞察解决实际问题。
6. 输出数据分析结论
数据分析的结果可以根据需要以Word或PPT的形式呈现。
报告应采取总分总的格式:
- 总述:阐述数据分析的背景、目的、目标、分析思路、目录、关键发现。
- 分述:对业务按多维度细分分析,用数据图表与相应结论阐述观点。
- 总结:提出结论与优化建议、行动计划、对业务发展做预测,提出策略与结论、附录。
根据实际工作需要,「报告」不一定是必须的,数据分析的结果是为了下一步的行动计划作支撑。
7. 测试验证
根据数据分析结论,按照计划开展优化测试,对测试效果展开分析,以此开启新的数据分析进程,形成数据分析工作的闭环。
三、数据分析的基本指标
(一) 基础数据指标
基础数据指标参考了增长黑客理论中的AARRR模型,针对用户从新增到流失的多个环节,来定义相应指标。
- 新增:日/周/月新增。
这里有两个维度,增量与增速。新增用户增速是产品增长的基础
- 传播:病毒系数、传播周期。
平均每位老用户会带来几位新用户?大于 1 的时候,产品才可能出现爆发式的指数增长。
老用户一般在注册(新增)后多长时间带来新用户?传播周期越短,增长速度越快。
- 活跃:活跃用户数DAU/MAU。
只有活跃用户才能为产品带来价值。
- 留存:留存率:次日、周、月。
使用产品的时间越久(活的长久),对产品的潜在价值越大
留存的计算业内有多种方式,但大多数采用了下方的计算公式:
次日留存率=(当天新增的用户中,第2天还登录的用户数)/第一天新增用户总数;
七日留存率=(第一天新增的用户中,在往后的第7天还有登录的用户数)/第一天新增总用户数;
月留存率=(第一天新增的用户中,在往后30天还有登录的用户数)/第一天新增总用户数
- 流失:流失率。
一段时间内流失的用户,占这段时间活跃用户数的比例。只有当产品新用户增长的速度大于老用户流失的速度时,产品的活跃用户数才会是正增长。
(二)用户行为数据指标
另一个维度,立足于用户行为,可以根据提升黏性、提升参与度、提升转化这三个目标定义具体的数据指标。
- 黏性指标:留存率、周活天
留存率反应产品是否满足用户需要。周活天反应用户忠诚度。
- 参与度指标:活跃度、停留时长、访问页面数量
- 转化指标:用户从上一环节到下一环节的转化率
这两种指标体系都具有参考价值,可以根据自身实际情况适当组合。
四、用户分群
(一)用户分群
用户分群是精细化运营的基础要求,也是数据分析的最基础方式。对用户进行分群,能帮助我们了解每个细分群体用户的变化情况,进而了解用户的整体现状及发展趋势。同时,由于运营资源本身有限,不可能真的做到一对一的个性化运营,但针对群体的运营是十分必要的。
(二)用户分群模型
用户分群的首要任务是根据具体的业务场景,确定不同的分类规则,给出清晰的定义。
1. AARRR模型分群法
借鉴增长黑客AARRR模型,可以把用户分为:
- 注册用户:通过不同获客渠道完成注册的用户。
- 活跃用户:注册且登陆的用户。
- 留存用户:一定时间内未流失的用户。
- 下单用户:对营收产生价值的用户。
- 忠诚用户:对产品高度认同及依赖的用户。
2. RFM模型分群法
(1)RFM模型——用于建立分群维度
传统行业对用户分类最常用的方法是RFM模型,RFM分别是三个英文单词的首字母。
- R(Recency)代表消费新鲜度。理论上,最近一次消费时间越近,说明此用户相对来说是比较优质的用户,对提供即时的商品或者服务,他们是最可能及时响应的。
- F(Frequency)代表消费频率。是用户在某段时间内购买商品或服务的次数。一般来说,消费频率越大,顾客忠诚度越高。
- M(Monetary)代表消费金额。消费金额体现用户的消费能力。
(2)用户五等分模型——用于明确分群规则
美国数据库营销研究所Arthur Hughes用户五等分模型,将指标按下列规则分类:
1)查询近一个月(查询时间往前推30天)所有内容创建者最近一次的登录时间。
2)按最近一次登录时间距离查询当日的时间排序:前20%标记为R5,记为5分;前20%~40%,标记为R4,记为4分;前40%~60%,标记为R3,记为3分;前60%~80%,标记为R2,记为2分;前80%~100%,标记为R1,记为1分。依此类推,将创建内容的用户分成五等分。
3)查询出内容用户在一个月内登录的天数,及创建的内容数,按同样的方法五等分进行标记。
4)将R5、F5、M5等同于5分,R4、F4、M4等同于4分,R1、F1、M1等同于1分,将每个顾客对应的三个数字相加,作为内容提供用户价值的得分。
(3)RFM模型分群法的应用
1)细分用户群分析
对某个或某几个用户分群进行分析,从而给出具有针对性的运营建议。如对R1、R2的用户进行分析,找到活跃用户的共性,从而反推用户不活跃或流失的原因。
2)顾客价值评估
基于用户五等分模型,对用户进行价值评估。在资源有限的情况下,可以优先满足10分以上高价值用户的需求,同时通过完善权益机制,激励9分以下的低价值用户升级,引导整个用户体系的良性发展。
用户价值划分:
3~5分:低贡献用户
6~9分:一般用户
10~13分:优质用户
14~15分:高价值用户
3)流失用户监控
基于R、M两个维度,对不同分值用户打上标签,区分出高价值忠诚用户、高价值流失用户等,以便展开具体的运营举措。
R≥3且M<3,打上标签:低价值忠诚用户。
R≥3且M≥3,打上标签:高价值忠诚用户。
R<3且M<3,打上标签:低价值流失用户。
R<3且M≥3,打上标签:高价值流失用户。
3. 关于「同期群」
同期群是一种用户分群的方式,按用户的新增时间将用户分群,得到的每个群叫一个同期群。
由于同一项产品改进对不同同期群中的用户产生的影响是不同的,分开衡量才更能反映真实的情况,因此,我们常常会进行同期群分析。同期群分析是指将用户进行同期群划分以后,分析和对比不同同期群组用户的相同指标。
五、数据分析模型
很多时候我们听到「模型」两个字都会觉得高深莫测,当然也有不少人会对这种「学院派」的做法嗤之以鼻。但实际上,模型只是「对数据分析思路的抽象」,通过模型能快速帮助我们梳理思路,理清数据的内在关联。
数据分析模型有很多种类,本文里我们不涉及技术,只对关键的逻辑模型做重点说明:
挖掘算法模型:主要是针对具体的业务问题,通过数学算法等方式输出计算结果,如预测、聚类、文本挖掘。
数据库模型:结合业务对底层数据进行整合
逻辑模型:是指通过一些指标的内在联系组合起来的可分析问题的模型。比如RFM模型以及「增长黑客」中常用的AARRR模型。
关于「增长黑客」的理论、方法、工具等内容,我们将在后续文章中详细介绍。
1. 4P营销理论(适用于业务整体分析)
4P营销理论是密西根大学教授杰罗姆·麦卡锡(E.Jerome Mccarthy)在20世纪60年代提出的。这个理论将营销组合的要素分为产品(Product)、价格(Price)、促销(Promotion)、渠道(Place)四要素,使得营销简化并方便记忆和传播。
- 产品:在产品维度,侧重回答我们的产品是什么?是否实现盈利?产品如何满足用户需求?产品的目标用户是谁?产品的优化是否有效?存在什么问题?
通常我们理解的产品是有形的,但实际上这是狭隘的观点。实际上产品可以是任何在市场存活的,满足用户某种需求的东西,它可以是实物,也可以是服务、人员、技术、组织、智慧等或以上若干种的组合。
- 价格:在价格维度,侧重分析产品如何定价?收入情况如何?ROI如何?哪些环节会影响到收入?
- 促销:促销维度则关注促销方式是什么,效果怎么样?
- 渠道:渠道质量如何?渠道覆盖如何?用户的渠道偏好是怎样的?
2. 5W2H(适用于向领导汇报数据分析计划)
5W2H是以5个以W开头的英文单词及2个以H开头的英文单词为缩写的简称,使用5W2H分析方法能很清晰地知道需要往哪些方面去思考和展开分析,帮助理清分析思绪。
- What:数据分析的对象是什么?
- Why:数据分析的背景是什么,为什么要做这次数据分析?
- Where:数据源是什么?
- When:数据采集时段是多久?
- Who:谁来执行具体的数据环节?
- How:如何执行?
- How much:需要投入什么资源?
3. 其他模型
- PEST:适用于宏观环境的分析。
- SWOT:适用于做战略分析。
六、用户生命周期价值
1. 用户终生价值的计算 (life time value)
LTV =(某个客户每个月的下单频次*客单价*毛利率)*(1 /月流失率)=(某个客户每个月的下单频次* ARPU *毛利率)*(1 /(1-月留存率))=用户生命周期内下单次数*客单价*毛利率
1)ARPU值的计算
ARPU(每个用户的平均收入)=某段时间内的总收入/同时期内活跃用户总数;
2)流失率的计算
流失率指的是一段时间内,有多少比例的用户不再使用你的产品了。所以流失率=在某段时间内流失的用户/同时期内活跃的用户,流失比较难定义,但留存比较好定义,故月流失率近似等价于1-月留存率;流失率的倒数用来表示预测的用户生命周期,如果一个产品的流失率为10%,则产品对应的生命周期为10个月。
2. 应用场景
1)评估运营活动是否盈利
单个用户毛利=用户生命周期价值-获取用户成本-运营成本= CLV - CAC - COC
很多产品在初期一直以补贴用户的形式来留住用户,长此以往,资金链一旦断裂,将无以为继。只有当用户的毛利大于0时,产品才能良性地、持续稳健地发展下去。
2)追踪投资回报率
计算公式:ROI =转化率* ARPU/ (CAC + COC)
七、数据指标的拆解
作为运营负责人,常常面临分工不明确,考核难量化等问题。
将KPI进行拆解也是常见的分析方法,其核心思想是将KPI指标(如营收)拆解到各个业务线去,再由各业务线进行二次拆分。
为了促进流量运营、用户运营、内容运营等各运营团队之间的协作,可以将营业收入KPI以乘积的方式分解成各运营团队的KPI,各团队不仅需要完成各自KPI还需要相互合作才能完成共同KPI,有效减少了团队间的内耗。
例如,若整个大部门背负着收入指标,则根据计算公式:收入=客单价*付费用户数=客单价*用户数*付费转化率,可以将客单价、付费转化率、用户数作为不同小团队的KPI。
八、数据可视化工具推荐
网络上可搜寻到的数据可视化工具非常多,在数据图表制作、平台操作上也大多相似,但也各有特点,可以根据展示效果需要来选择工具。
1)花火Hanabi
可制作数据动图、短视频素材
2)镝数图表
除了数据图表制作外,有大量模版,可以制作数据展示的海报、长图文
3)图表秀
可制作PPT格式的数据分析报告、制作在线数据网站(包含点击交互效果)
4)思迈特Smartbi
企业数据分析BI解决方案
5)Datawrapper
适合外企,可制作图表、地图、报告,支持导出链接、pdf等格式
作者: AliG 运营人都在看的知识库