终于有人讲清楚数据分析全流程了!

从最初的做数据管理工作,到逐渐负责指标体系梳理、预警机制搭建、BI系统建设、商业分析等工作,我越来越认同——“要做什么”是比“要怎么做”更加重要的问题。一个数据分析问题,例如“分析一下竞品的情况”,让人感觉无从下手。通常是因为这个问题过于抽象,过于复杂,从而让我们不知道“要做什么”。这时候我们就需要对问题进行拆解,把抽象的问题变具象,把复杂的问题变简单。这个拆解过程就要求一个数据分析师对数据分析的整体框架有所了解。换言之,Ta应该能够回答:数据分析的工作流程是怎么样的?从工作事务的角度出发,我们可以将数据分析的工作流程划分为10个模块。该划分基于 “跨行业数据挖掘标准流程”( CRISP-DM),修改、扩充。目的在于涵盖商业分析的工作内容。

-数据分析的工作流程图-完成这10个模块的工作,需要我们回答以下10类问题。这10类问题围绕着“问题”、“数据”、“方案”三个核心关键词展开。⏩1. 问题界定问题:需要解决的问题是什么?制定方案:针对这个问题,(从数据出发)给出的解决方案是什么?⏩ 2. 数据定义数据:根据预设的解决方案,需要的数据有哪些,是什么样形式的?获取数据:所需的数据是可得的吗?从哪里可以获取?理解数据:获取的数据蕴含了哪些信息?处理数据:为了执行解决方案,我们还需要对数据进行哪些处理?⏩3. 方案验证方案:根据现有的数据,预设的解决方案可行吗?最初的问题可解吗?评估方案:内部评估,预设的方案多大程度上解决了最初的问题?需要如何改进?实施方案:以什么方式,能准时、保质保量的交付解决方案?评价效用:外部评价,实施后的解决方案效果如何?有多少价值?产生了什么影响?需要如何改进?如何利用数据分析全流程来指导实践?以上提出的数据分析工作流程的描述,还是挺抽象的。以下,用三个不同复杂程度的实例来说明——如何利用数据分析工作流程的方法论来指导实际工作。一、简单模式:“好好,这份业绩报表以后你来刷新维护。”我的第一项数据分析工作,就是定期刷新一份已经设计好的业绩报表。这份工作非常棒,因为这项工作只涉及了工作流程中3个模块:⑥ 处理数据、⑨ 实施方案、⑩ 评价效用。

-业绩报表刷新涉及的工作流程图-而至于其他模块:① 界定问题:在报表设计之初,就已经界定好了问题:我们要评估一下业绩的现状。② 制定方案:并制定了一个交付物为报表的解决方案;这个报表中包含了我们用来衡量业绩的诸多指标,如:销售额,产能、产品结构等。③ 定义数据:计算这些指标所需的源数据也已经定义好了。④ 获取数据:可以直接从公司内部的系统获取数据。⑤ 理解数据、⑦ 验证方案、⑧ 评估方案这三个模块,前辈们也已经完成了。所以更新业绩报表工作,只需要处理从系统中获取的数据;然后制作报表,并交付。对该项工作效用的评价方式为:及时性与准确性。二、复杂模式:“好好,买了份咨询公司的数据,你分析一下市场情况。最好能够预测下季度的销量。”假设你是麻雀水果贸易公司的数据分析师。现在老板从百灵鸟咨询公司买来了一份整个市场的销量数据。要求你根据这份数据,分析一下市场的情况,并对后续的销量做出预测。这项工作的需求是相对明确的,这是一个描述现状和预测未来的需求。数据的来源,老板也花了数十万美金帮我们搞定了。所以我们不需要花太多的精力在① 界定问题 和 ④ 获取数据的模块。

-市场评估与销量预测的工作流程图-我们粗略的看一下其他部分的模块应该要怎么做:② 制定方案:针对描述现状和预测未来的需求,我们分别制定方案给出响应。对于描述现状的需求,我们给出解决方案A。从宏观到微观分为三个层次描述市场状况:行业、公司、产品。对于预测未来的需求,我们用多元线性回归模型作为解决方案B。所以对于这项工作,我们将有两个交付物:一份分析报告,以及一个预测模型。③ 定义数据:为了能够落地方案A与方案B,我们需要:宏观经济的数据;市场上产品的销量数据,并且这些数据要能够区分品牌、区分销售渠道、区分价位等;此外产品本身特性的数据;以及咨询公司提供的一些二手资料、结论等。⑤ 理解数据:我们要对咨询公司提供的数据做一些探索性的工作,获取更多的信息。当我们获取的信息量更多之后,或许我们可以回到 ② 方案制定 的模块,做出更好的设计。也可能我们发现,目前的数据,不足以支撑我们的分析需求。那么就要回到 ③ 获取数据 的模块,补充所需的数据。⑥ 数据处理:将数据加工为我们所需要的形式,指标等。这个过程的实施,可以是使用python、Excel、ETL流程等任何工具、方式、手段。⑦ 验证方案:将处理好的数据代入解决方案,得到结果。如果没能顺利得到结果,定位一下是②~⑥的哪个环节出了问题。⑧ 评估方案:评估得到的结果是否解决了最初的两个需求。例如:方案A的分析报告,是否给出了我司在市场中地位的结论。方案B的预测模型,对过往季度的销售额的预测准确度如何。如果还有可改进的部分,在保证交付的前提下,返回模块 ⑦ 验证方案 进行优化。⑨ 实施方案:将两个交付物交付给老板,以及相关干系人(部门)。⑩ 评价效用:收集他们的意见与反馈。分析报告是否给相关决策提供支撑,预测模型在下季度的准确度如何?三、地狱模式:“找点数据,分析一下吧。”这时候需求很难界定方案无从谈起数据没有来源验证依靠幻想实施更不可能(有一说一,这不就是科学家的工作吗?)了解IT相关内容,各平台同名“职坐标在线”

(0)

相关推荐

  • 身为数据分析师,要学会保护自己鸭~

    这是POINT小数点的第 438 篇文章 点点写在前面: 这篇文章来自用户画像pointer 明河的分享.往期他分享过关于数据分析我们应该有一个理性的认识,既不能忽视数据分析在当今企业中发挥的作用,也 ...

  • 点、线、面、体,5分钟解读数据质量

    数据质量是数据治理领域的基础性课题,既是治理的目标,也是治理的抓手.同时,数据质量的提升,表与里,标与本,制度建设和群体共识,激励机制和系统平台,关系面很大,撸起袖子后如何着手,需要思考. 今天,我们 ...

  • 如何搭建一个企业级数据分析体系?

    回顾一下上文的内容:一个企业级数据分析体系的最佳实践应该是这样的: 内部感知系统:及时告知各项内部运营参数: 外部感知系统:及时反馈外部竞争.机会状况: 报警系统:及时发现并报告各项异常,并指明故障点 ...

  • FineReport报表

    地产行业 医药行业 银行行业 证券基金行业 化工行业 零售行业 电子电气行业 时尚行业 IT软件行业 互联网行业 地产行业 依托帆软深厚的技术底蕴与大数据应用的经验,全面打造"大数据+地产& ...

  • Sentieon与华大智造合作推出高通量测序数据分析一体机

    近日,MGI与Sentieon合作正式推出高通量测序数据分析一体机Zieon.双方团队详细讨论并测试了华大智造MegaBOLT和Sentieon软件模块的性能,采用合适的模块组合推出了Zieon数据分 ...

  • ACHEMA趋势报告| 全力加速的数字化进程

    智能的自动化解决方案已成为行业的香饽饽.目前,流程工业面临的巨大挑战是生产需求的波动,企业应尽可能快地将产品投放到市场,这就要求流程设备运营商有着很高的生产灵活性,也对流程设备和相关设施的自动化提出了 ...

  • Excel技巧—为什么学习Excel

    吾生也有涯,而知也无涯 点赞再看,养成习惯 自从个人计算机开始普及以后,Excel就得到了广泛的传播,工作学习生活中不处不存在Excel的影子,不论是考勤,工资还是其他的统计等等,都离不开Excel. ...

  • 风控的数据分析都分析些什么内容?

    在量化风控时代,数据分析是一个最基本也是最重要的环节,对风险管理的影响很大. 一个优秀的风控人不仅要懂得怎么提数做分析,更要懂业务.资深的策略分析师更是需要结合数据分析的结果提供到位的解决方案. 不少 ...

  • 数据分析师的日常工作有哪些?开课吧

    想要成为数据分析师,首先需要的就是对这个行业以及职业进行了解,这包括需要的技术.岗位职责.岗位需求等,那么数据分析师的日常工作有哪些呢? 数据分析师的日常工作有哪些?开课吧 数据分析师的日常工作大概分 ...

  • 终于有人讲清楚DeFi到底是什么、能干嘛了

    摘要:作者 | 小派克编辑 | 郝方舟从2019年年初起,DeFi成为区块链领域里的长线热点话题.提供DeFi服务的平台和产品也如雨后春笋般破土而出.其中,去中心化借贷项目在市场上掀起不小的波澜.De ...

  • 金融的本质是什么 ?终于有人讲清楚了 !/捞干货

    众所周知,金融行业是一个"多金"的行业,但凡有人在金融圈混,我们都会觉得他自带"光环". 这是为何呢?因为大部分人不懂金融.因为稀缺,所以信息不对等就会存在,而 ...

  • 金融的本质是什么?终于有人讲清楚了!

    众所周知,金融行业是一个"多金"的行业,但凡有人在金融圈混,我们都会觉得他自带"光环". 这是为何呢?因为大部分人不懂金融.因为稀缺,所以信息不对等就会存在,而 ...

  • 终于有人讲清楚资产和负债了

    人人都渴望着可以实现财务自由,但同时还有很多人搞不清楚什么是资产和负债,甚至错把负债当成资产,实际上一些你以为是资产的东西,却也可能是你的负债. 举个例子,房产在很多人眼里是有形的物质资产,买在地段不 ...

  • 一德:风水中的青龙、白虎,是什么意思?终于有人讲清楚了!

    把八卦套在房子里面起作用,看着先天八卦图,我们再用五行来表示一下. 五行就是木火土金水. 东方属木,东方是太阳升起的地方,万物复苏,也代表春天,树木植物开始往上面生长,所以东方属木. 南方很热,它是老 ...

  • 金融的本质是什么?终于有人讲清楚了

    众所周知,金融行业是一个"多金"的行业,但凡有人在金融圈混,我们都会觉得他自带"光环". 这是为何呢?因为大部分人不懂金融.因为稀缺,所以信息不对等就会存在,而 ...

  • 王立华演讲:终于有人讲清楚了!

    王立华演讲:终于有人讲清楚了!

  • 组间差异检验,终于有人讲清楚了!

    个是p值,可以判断这种组间与组内的比较是否显著:一个是R值,可以得出组间与组内比较的差异程度.Anosim用来检验组间的差异是否显著大于组内差异,从而判断分组是否有意义,Anosim分析使用R veg ...

  • 嗅探技术与RPA:终于有人讲清楚了

    UB Store 在"新基建"全面铺开落地的大背景下,随着各行业数字化转型的深入,国内RPA市场正处于一个活跃期,越来越多企业开始在业务流程中引入RPA. 与此同时,国内RPA人才 ...