《数据分析思维》
你好,欢迎来到小帮听书。
今天为你分享的这本书是《数据分析思维》。
作为一名职场人或投资者,相信大家在工作和投资的过程中,都或多或少地遇到过各种各样的数据。然而,当你拿到一堆纷繁复杂的数据之后,你是怎么处理和利用这些数据的呢?通过一系列数据,你又是如何分析并得出某个结论的?
显然,在这个大数据时代,数据在我们的工作和投资中,已经出现得越来越频繁了。但是,相信许多人至今一提到数据,就感到非常头疼。那怎么去解决这个问题呢?
其实,只要能学会数据分析思维,你不仅不用再为数据而感到苦恼,而且,无论你是准备找工作,还是打算投资某个行业,用这本书中提到的分析方法,你都有可能会事半功倍。
今天要给大家讲的《数据分析思维》这本书,不仅仅告诉你如何使用数据,它还将帮助大家把数据思维给建立起来,学会通过数据分析,来解决各个领域当中面临的各种难题。
这本书分为两篇,第一篇主要讲方法,包括指标、分析方法和如何使用数据分析解决问题等方面的知识。第二篇讲实战,主要介绍数据的具体运用。我们今天就结合一些工作和投资中的案例,来讲一讲数据分析的方法和思维。为了方便大家理解,我们把这本书的内容分成了三个重点:
第一,如何使用数据建立指标体系?
第二,分析问题的两个实用方法。
第三,通过数据分析解决问题的三个步骤。
一、如何使用数据建立指标体系?
我们先来看第一个重点内容:如何使用数据建立指标体系。
现在各行各业的从业者,都会遇到大量令人棘手的数据,既有产品数据,又有用户数据,还会有广告数据,等等。今天我们以新媒体平台为例,来给大家来讲讲如何分析数据。比如大家熟悉的今日头条,如果你在这个平台上发文章,它的后台就可以看到非常完整的数据,这里面的数据,就可以作为我们学习数据思维的敲门砖。
我们接下来就先结合这里面的数据讲一讲相关的知识。
一般情况下,我们在今日头条上能见到的数据,包括读者的性别、年龄、所在省份,等等。
图片来源:今日头条
图片来源:今日头条
当我们拿到这样一份数据的时候,我们该如何去理解这些数据呢?
通常情况下,数据主要分为三种,第一种叫做用户数据。
用户数据,主要回答的是“用户是谁”的问题,它指的是用户的基本情况,包括id名称、性别、年龄,等等。
就拿今日头条里面的这个数据来说,在这些数据当中,就包括阅读这篇文章的读者的性别、所在省份、年龄等信息。比如,你发布了一篇文章,男性读者占90%,年龄主要在40岁以上,广东、福建、浙江和江苏的读者占85%,这些都属于用户数据。掌握这些数据有什么用呢?
了解这些数据,你就能大体上分析出你应该写什么样的文章,才能吸引用户的关注;你的文章是一线城市的读者更喜欢,还是二三线城市的读者更喜欢。有了这些信息,假如你要在你的账号发一篇广告,你就知道如何选择适合读者口味的广告内容。
第二种叫做行为数据。行为数据,主要是记录用户做过什么。
就拿头条号的运营来说,你所发的每一篇内容,都可以从后台看到阅读量和打开率是多少,阅读的完成率大概是多少,等等。
比如,阅读完成率高达90%,意味着读者读你的这篇文章时,看完了90%的内容。这说明,这篇文章对读者的吸引力非常大,他们很感兴趣,几乎一字不漏地读完了文章。
你看,这里的数据虽然是死的,但是从数据里面,我们却能分析出用户做过什么,大概做到了什么程度。
第三种数据叫做产品数据。具体包括产品的名称、类别、产品的转发收藏量,等等。
如果我们把头条里面发的文章看作是产品,你就能看到不同的产品的转发和收藏的数量。这些数据的数量越多,就说明你的文章越受欢迎。
这些数据表面上看来没太大作用,而且很单调,很乏味,但是,我们通过仔细分析这些数据,对我们更好地运营这个账号,写出更适合读者口味的文章,产生了巨大的帮助。
比如,你现在写了一篇关于理财的文章,结果发现转发和收藏的数据特别好,这就说明读者觉得你的文章有用。你就能通过这些数据,了解到读者的真正需求是什么。下一次,你还可以继续创作类似的文章,帮助用户更好的解决问题,同时也能赢得更多关注。
当然了,大家不一定都对新媒体的运营感兴趣。不过也没关系,各行各业的数据都是相通的,绝大多数数据都可以归纳到这三种数据当中,而且,绝大多数数据也都是有指向性的,在数据背后,往往反映出用户或者产品的某种状态。
在认识数据的过程中,我们还要学会选择我们的数据指标。换句话说,并不是所有的数据,都是值得我们利用的“好数据”。在《数据分析思维》这本书里面,作者就认为,我们在分辨这些数据的时候,一定要把握住两种数据指标。
第一种是带有明确比例的指标。
比如说,你的头条账号每日活跃粉丝有1万,如果仅仅看这个数据的话,其实没有多大意义。但是,如果你的粉丝一共有5万,那拿1万除以5万,再换算成百分比,得出的这个数据是20%,这个20%,就是一个明确的比例指标。这个数据可以说明你的账号粉丝的活跃程度。
再比如,阅读完成率,文章的打开率,等等,这都是一个比较明确的百分比数据,像这种百分比数据,就是明确的。
所以,我们以后不管遇到什么数据,都应该养成把数据转换为比例指标的习惯,因为比例指标比简单的数字数据更有意义。
第二种是核心指标。
所谓的核心指标,指的是衡量某项业务的最重要的几个指标。
就拿新媒体运营来说,文章的阅读点击率、阅读完成率、评论收藏和转发率,等等,代表着一篇文章的受欢迎程度,它们都是核心指标。
不同的公司,也都有着不同的核心指标,比如大家都知道的Facebook,这家公司的核心指标就是月活跃用户率,喜马拉雅APP的核心指标是用户的收听时长。
当我们拿到一份数据的时候,我们要学会先找到其中的核心指标,重点关注核心指标的数据。
最后呢,我们还要学会把现有的数据,组建成一个指标体系。
什么叫指标体系呢?如果把指标比做成树木,那么,指标体系就是由一棵棵树木组成的森林。所以,所谓的指标体系,指的是从不同的角度梳理业务,把指标有系统地组织起来,组成一个体系。
在《数据分析思维》这本书中,作者就提出了一个组建指标体系的方法。
首先,第一步,我们可以根据部门的目标,找到一级指标。
我们仍然拿运营一个头条账号来举例子:假如我们现在主要的工作是运营一个账号,那么,我们在运营这个账号的过程中,最重要的目标是什么呢?
大家可能也知道,对做新媒体的人来说,写文章,一是为了获得粉丝的关注,二是靠接广告赚钱。所以, 运营一个头条号,最重要的指标就是粉丝的增长率和文章的阅读量。你看,这样我们就找到了一级指标。
接下来,第二步,我们要了解业务的运营情况,找到二级指标。
我们之前也说了,我们写文章不单单是获得大量粉丝,还要通过接广告来赚钱。那怎么赚到更多的钱呢?当然是广告转化率。这是牵涉到“业务”运营的数据,它也是我们要找的二级指标。
最后,我们再梳理业务的流程,找到三级指标。
这时候我们要根据二级指标进行细分,比如,文章的打开率、阅读量、阅读完成率、转发,等等,这些数据就是三级指标。
这样细分一下,我们就能得出更加具体的指标。有了这些指标,我们基本上就把整个账号的数据给掌握了下来。后面如果再写文章的时候,我们就可以根据对这些数据的分析,产出读者喜欢看,且转化率更高的文章了。
当然了,前面我们都是在拿新媒体运营在举例,但是,其他行业的,尤其是做产品的时候,分析数据的思路跟刚才所讲的都是相通的。
二、分析问题的两个实用方法
好,接下来我们再来介绍两种非常实用的分析方法。
第一种方法,叫做行业分析法。
行业分析法的主要应用场景有两个:一个是你在对自己的职业进行规划的时候,准备寻找一个值得你去耕耘的行业;第二个是,你在职场上工作的时候,需要对外部环境或者行业竞争对手进行分析,制定公司的发展策略。这两种场景,都会用到行业分析法。而且,当你看完下面的分析方法之后,你会发现,其实在投资中,分析行业的时候也能用到这种方法。
我们在使用行业分析法的时候,一般会从政策、经济、社会以及技术四个维度对某个问题进行分析。
比如,你现在想找好赛道的个股进行投资,或正准备跳槽,接触一些新行业的公司,那该怎么分析呢?很简单,你可以先从政策上来对某个行业或公司进行分析。
政策,主要包括投资政策、税收政策、行业的扶持政策,等等。
我给大家举一个例子:大家在新闻上可能看到,2019年,上海浦东东南角的临港,响应国家号召,建设起了自由贸易试验区,这个地方现在也被称为临港新片区。
从政策上来讲,临港新片区的几个支柱产业,包括金融、集成电路、人工智能、民用航空、生物医药,等等,都得到了政策的大力支持。这几类产业下的公司发展会比较顺利。另外,研究生学历的人才到这里工作,可以享受五年落户的政策,如果是应届生,在临港工作一般还额外加三分的落户积分,并且享受每个月一千元的补贴。有重大贡献的人才,不仅工资收入高,职业前景大,而且落户上海也更加简单。这能帮助这些公司吸引到更优质的人才,有利于未来的发展。
其次,我们还得从经济环境上对某个行业进行评估。
经济环境,一般决定着这家公司未来的市场能做到多大,这里面就会牵涉到一大堆数据。比如,这家公司的目标用户都是哪些人?他们的年龄分布是怎样的?收入分布又是如何?购买商品的习惯如何?教育水平如何?等等。
我们在分析经济环境的时候,可以按照我们第一部分所讲的知识点,大体上罗列出一个评估的指标体系。
假设我们现在要进入临港的一家做家电的人工智能公司,或者打算投资这家公司,想知道这家公司的前景怎么样。那我们就可以这么分析,首先,我们先确定一级指标:这家公司产品的人工智能家电产品,市场占比是多少?投资状况如何?然后,再确定二级指标:这家公司的人工智能产品利润是多少?科技转化率又是多少?等等。最后,我们再确定三级指标:这家公司的产品各个人群分布状况如何?各个地区的市场情况又是如何?哪个阶层的人更喜欢这家公司的产品?等等。
当我们建立了这样一个指标体系的时候,我们大体上就能预测到这家公司的发展前景。
第三,我们要对社会环境进行分析。
人工智能家电这个行业,目前的用户主要集中在哪些省份或者哪些城市?用户的经济状况和认知水平如何?随着社会的发展,未来的潜在用户群体有多大?
我们在对社会环境分析的时候,都要不停地把这些问题抛给自己,然后再去按照刚才的方法,查阅资料,建立我们的三级指标体系。
最后,我们还得从技术环境的角度对这家公司进行分析。
就拿人工智能家电这个行业来说,我们可能要分析它的人工智能技术的成熟程度,这里面可能包括AI技术、大数据技术、5G技术、材料制作技术,等等。虽然我们不懂这些技术,但只要知道这家公司的技术排在行业内的第几名,大概就可以知道它在行业内的影响力了。这也是我们在评估的时候,可以设计一个评估的指标体系。
你看,当我们从政策、经济、社会和技术四个维度,结合我们之前所讲的数据指标体系方面的知识,我们就能很准确地对一家公司,或者一个行业进行分析,然后确定这家公司或者这个行业的前景,最后再决定要不要入场。
好,我们再来看第二种分析方法:逻辑树分析法。
逻辑树分析法,指的是把复杂的问题拆解成若干简单的子问题,然后向树枝一样,逐渐展开,形成一棵让人一目了然的“逻辑树”。
大家应该都听说过硅谷钢铁侠马斯克,他现在有一个特别宏大的目标——用宇宙飞船,每次携带200名乘客去火星。这个目标是不是很夸张?是不是有点天方夜谭?但是马斯克并没有觉得自己的想法很荒谬,相反,他把他的这个看似不可能实现的目标,分解成了一个个可以解决的子问题。
首先,火星移民最大的困难是什么?马斯克说过,是钱。大概要花多少钱能?根据马斯克的估算,一个人得花一百亿美元。这个价格显然太高了,所以马斯克的目标是,把花费降低到20万美元。
那么,问题就来了,把成本从100亿降低到20万,这简直是天壤之别,怎么才能实现呢?马斯克把它具体拆解成了四个子问题。
第一,如果按照以往的认知,载人航天用的都是火箭发射器。但是,火箭只能使用一次,用完了就得造新的,所以成本很高。马斯克的做法是,大力发展可以循环利用的飞船,就是那种可以飞去火星,再飞回来的飞船。所以他成立了SpaceX公司,专门研究这种太空探索技术,如果这种技术研发成功了,火星移民的成本也就降低了。就在去年,SpaceX公司还发射了代号为星舟SN8的载人飞船,马克斯在成功的道路上,显然又进了一步。
马斯克继续拆解自己的目标,得到的第二个子问题是:飞船如果直接装满整个太空航行所需要的燃料,然后再发射,这就会导致飞船的重量过重,浪费大量的资源。怎么去解决这个问题呢?马克斯想出的办法是,先在太空设置一个“加油站”,然后在太空轨道上,给飞船进行补给。也就是说,把飞船先送到太空,这时候不必带那么多燃料,等到了太空时,再去“加油站”进行燃料补给。
第三,马克斯认为,还得在火星上制造燃料,这样就可以保证飞船能够飞回地球,这样成本还能继续降低。
最后,同样是为了缩减成本,马克斯认为,还需要使用正确的燃料。经过分析之后,他认为使用甲烷作为燃料最合适,因为火星上制造甲烷就很简单。
你看,把费用从100亿美元降低到20万美元,原本是一个无解的问题,但是,马克斯根据这个问题,一共细分成了4个可以解决的子问题。当然,这四个子问题还可以继续细分,比如,对于第一个子问题——如何发展宇宙飞船技术,我们还能细分成诸如如何解决燃料问题,如何解决飞船的回收问题,如何降低飞船的发射风险,等等。这样一来,一棵庞大的逻辑树就形成了。
我们在工作的过程中,也可以把一个具体的问题,细分成许多个有逻辑的、可以解决的小问题,然后再挨个去解决。
最后我们再小结一下:不论是行业分析法,还是逻辑树分析法,都对我们建立数据指标体系非常有帮助。比如,行业分析法的政策、经济、社会和技术,其实就包含了许多需要我们查证的政策数据、经济数据、社会数据和技术数据,这四个不同层面的数据结合在一起,正好可以帮助我们建立起一个完整的指标体系。
逻辑树分析法也一样:当我们拿到一大堆数据的时候,我们就可以把数据进行分类整理。比如,哪些数据是核心数据,哪些是核心数据延伸出来的从属数据,等等,我们按照一级指标、二级指标和三级指标,一一归类,最后得出的就是一棵逻辑树。
三、通过数据分析解决问题的三个步骤
好,讲完了两种非常典型的分析方法,我们最后再来讲一讲使用数据分析解决问题的三个步骤。
先看个例子。假设公司给了你一个超级大难题:需要在今年月平均盈利达到200万,也就是说,全年要完成2400万的利润额。但是现在已经过去六个月了,目标却还没完成一半。现在你的领导让你通过数据分析,尽快找到利润没有达标的原因,并且要你拿出完成年度目标的具体完成方案。
这时候你该怎么办呢?许多人面对这个模糊的问题,可能会感觉到一头雾水。也有许多人能找到一些原因并且写出方案,可是找出的原因却没有逻辑,方案也缺乏依据、缺少分析,领导看了觉得很不满意。如何才能找到原因,并且写出一份有理有据的方案呢?
首先,第一步,你要明确问题。
也就是说,你要先搞清楚,你所面临的这个“问题”,到底是不是一个问题。所以,你应该先从时间、地点和数据来源三个方面,判断数据的来源和准确性。
就拿领导给你的这份数据来说,这份数据确定是1到6月份的数据?这些数据确定是全国范围内的数据,或者仅仅是一个地区的数据?数据的来源是销售部门?还是领导自己估算的?等等。
如果数据没有问题,那你再确认并理解业务指标。
这个案例牵涉到了利润问题,可是,你们公司的“利润指标”是如何定义的?是拿销售收入减去产品成本?如果产生了其他的销售费用,是不是从利润中扣除了呢?又或者,假如公司上半年给附近的希望小学捐款捐了100万,这个数据是不是也从利润中除掉了呢?
对于这些问题,我们都需要找到公司的销售部门,一一明确。
这些数据都了解清楚之后,接下来,再进行第二步:分析原因。
分析原因,需要使用到我们在前面提到的分析方法。假如今年上半年只完成了400万的盈利,距离1200万的盈利还差一大截,这时候我们可以先通过行业分析法来进行分析:
在政策方面,今年上半年是否出现了不利于我们发展的政策?或者政府对我们行业的政策扶持是不是变少了?
在经济方面,上半年受到疫情的影响,全社会的经济都不景气,是不是我们行业都受到了较大的冲击?
在社会方面,同样是受到疫情的影响,我们的客户是不是变少了?客户的需求是不是也变少了?
在技术方面,我们公司上半年用于研发的投入是不是也偏少,被竞争对手给追赶上了?
从这四个维度出发,我们基本上就可以分析出问题出在哪里。当然,我们还需要结合逻辑树分析法,将每个问题继续分解成更加细化的子问题。
比如,在经济方面,对于“上半年经济不景气,是不是我们行业都受到了较大的冲击?”这个问题,我们就可以细分成这样几个子问题:上半年的国家层面的经济数据分别是多少?我们整个行业的销售额下滑或者上涨了多少?竞争对手的利润率如何?我们的生产成本和采购成本增加了多少?销售成本增加了多少?员工的成本又增加了多少?等等。
如果我们把每个大的问题都进行细分,我们就能得到一棵非常“茁壮”的逻辑树。而且,这棵逻辑树中拥有非常庞大的数据,这些数据正好建立起了一个完整的数据指标。
最后,第三步,我们再根据逻辑树中的子问题,提出建议。
在经过了前面的准备工作之后,这一步就比较简单了。也就是说,我们提出了怎样的问题,就可以根据问题去寻找答案。
比如,我们通过整个逻辑树分析法,进行分析的结果是,上半年的利润不达标,并不是因为受到疫情的影响顾客变少了,而是因为产品的生产成本和销售成本增加了,那这时候我们就可以针对性地提出缩减成本的建议。
当然,上半年的目标没有完成,全年的目标我们肯定还是要完成的,所以,即便是我们的顾客没有减少,但我们仍然要开发更多的顾客,这样才能提升我们的销售量。
你看,通过结合数据,对一个模糊的问题进行理性分析,我们就可以得出一个完整且精确的结论。
好,以上就是《数据分析思维》这本书中的重点内容。听到这儿,大家可能会有这样一个感受:平时一看到数据就头疼,看来数据也并没有那么复杂嘛!其实不同的数据之间都是彼此相关、相辅相成的,只要分清数据的主次,结合一定的逻辑,把数据整理成一个指标体系,再复杂的问题也能找到适合它的解决方案。
积沙成塔,每天进步一点点,恭喜你又听完了一本书。我们下期再见!