写给新手小白的数据分析入门指南,从思维、方法到实践

从我的数据分析课程开讲以来,收到了不少朋友的问题:我是做运营的想入门数据分析应该怎么学?新手做数据分析有哪些好用的工具?会用Excel但是做分析总是没思路怎么办?做数据分析有哪些方法......等等一系列的问题,今天我就用这篇文章统一回答关于数据分析入门的问题

数据分析是什么?

很多人都没有搞懂数据分析是什么,包括一些公司和企业也没搞清楚数据分析的定义。经常听到有人说投了数据分析的岗位,结果入职之后每天干的活就是取数给业务用,感觉自己就像个取数机。这样的工作根本不能叫做数据分析。

什么是数据分析,用我自己的话来说就是针对某个问题,将获取后的数据分析手段加以处理,并发现业务价值的过程。这一句话也基本涵盖了数据分析的流程:目标确定——数据获取、清洗、整理——数据分析——结果呈现

数据分析需要哪些能力

数据分析师需要会哪些技能,围绕上面数据分析的基本流程,我把数据分析师的能力分为这样三大部分:基础知识、工具技能、分析方法与思维,以下师数据分析的技能大纲,图中标记了能力等级,大家根据自己的情况对应学习:

数据分析基础知识

数据分析理论知识这方面,需要掌握是统计学和机器学习相关知识。

1、统计学

毫不夸张的说统计学是整个数据分析的灵魂。判别一个数据分析师强弱的一个重要方法就是,看他对统计规律的敏感度。这里我们需要从基础的统计理论(描述性统计、区间估计、假设检验等)出发,到基本的统计分析(T 检验、方差分析等),最后到商业常用的模型(回归分析、方差分析等),学习数据分析背后的逻辑,掌握实用统计学的概念和会利用统计的思维去思考问题。

推荐书籍:《深入浅出数据分析》、《统计学习方法》李航

《深入浅出数据分析》这本书非常推荐作为小白的入门书籍,特别是之前没有接触过数据分析的。特点和书名一样深入浅出,而且图多。里面没有那么多公式和理论,但其中对于统计的基本原理以及统计问题的来源场景介绍的非常通透,非常符合深入浅出系列定位如果有之前有一定基础,建议略过。

2、机器学习

对于想要进阶成为高级数据分析师的朋友来说,就要掌握机器学习相关的知识:

特征工程的基础:如何统计数据特征、选用不同的特征,做模型的优化;

基本的分类算法:决策树、随机森林等;

基本的聚类算法、数据挖掘、常见的机器学习算法的了解等等

机器学习相关的知识学习成本会比较高,对某些同学来说可能会有一定难度,但对于业务型数据分析师来说,一般不会要求你去推导算法公式,能做到明白不同算法的适用场景、优缺点、原理大概懂就基本可以了。

推荐学习书籍:《机器学习》周志华,网上也有不少学习视频,入门的话我推荐吴恩达的coursera机器学习课,

数据分析工具学习

1、PPT

为什么把PPT放在第一,原因很简单,我们做数据分析的目的是什么?当然是为了展示给客户、上级,供他们做决策。所以PPT作为主流汇报、展示工具,是将分析关键结果传递给其他的重要手段。学好PPT可以提升沟通和消息传递效率,也是数据分析师必备的技能具体学习书目我就不做推荐了。

2、EXCEL

EXCEL应该是数据分析师最常用的统计分析工具了,原因是因为方便,所见即所得,而且具有方便的可视化功能。应该说只有学会了Vlookup,数据透视和基本公式才算EXCEL入门,其次EXCEL最大的惊喜是数据可视化,拥有大量的图表模板,可以减轻我们很多工作。

这里我推荐《谁说菜鸟不会数据分析》这本书作为EXCEL入门这本书如果作为数据分析入门书籍是不合格的,因为它有太多内容是关于EXCEL基本操作的,关于数据分析的内容反而很少,但是实事求是的讲这本书里面关于EXCEL数据分析常用公式、数据可视化的内容还是不错的,可以当成一本入门书籍。

3、ACCESS

为什么把ACCESS作为中级数据分析师必备技能,原因很简单,当数据太大,EXCEL又处理不了,又没有很强的编程基础怎么办?ACCESS的优势就体现出来了,它可以在不用掌握很高深编程语言的条件下,处理Excel所不能承载的大存储量的数据原始文件,速度奇快,且易学易用

作为入门,我推荐《表哥的Access入门》这本书通过一个简单的小饭馆数据库管理程序的开发过程,对理解数据库和学习一些基本的ACCESS很有帮助。

4、SQL

作为数据分析人员,要想获取数据,肯定就要和数据库打交道,因此sql肯定是要掌握的,在招聘要求中,sql也是很多数据分析岗位的能力要求之一。学习SQL最快的方法是能自己下载数据库管理工具,找些数据练习,主要了解一些数据库查询语言,where,group by,orderby,having,like,count,sum,min,max,distinct,if,join,left join,limit,and和or的逻辑,时间转换函数等。

推荐书籍:《MYSQL必知必会》

5、Python

Python作为目前最火的编程软件之一,确实在数据分析、数据挖掘上有着独特优势。是否具备编程能力,也是初级数据分析和高级数据分析的分水岭。以下以python的学习路线图:

看起来要学习的内容挺多的,但其实python最大的优势就是语言简约,非常易于读写,如果之前有一定的编程基础,上手很快。推荐书籍《Python编程快速上手》,新手可以跟着书里的内容一步步做,把里面的项目做完,差不多就入门了

6、商业数据分析软件

excel做数据分析难以解决大数据量的问题,对没有编程基础的人来说上手python又比较难,这时候可以选择利用数据分析软件来做数据分析,现在市场上的数据分析软件基本都涵盖来数据采集、处理、分析到可视化展现的过程,操作简单,可视化效果很棒,比较适合新手入门。比较好用的有FineBI、tableau 等等

数据分析方法

学习数据分析肯定有人上网百度了不少数据分析方法,什么漏斗分析法,PEST,SWOT模型、杜邦分析法等等。并且由于不同版本的演绎,造成了分析方法种类繁多,令人眼花缭乱,关于分析方法值得一说的就是一定要结合行业特点,特别是对业务的掌握,这样才能事半功倍。下面简单列几个比较通用的分析方法:

1、对比分析法

对比分析法常用的基础分析方法,虽然方法特别简单,但几乎所有的分析报告中,都会采取对比分析方法。比如去年同期相比、上个月环比、目标和实际达成相比、各个部门和业务线相比、行业内竞品比较、营销效果对比,等等。这里需要注意的是我们不管是横向比较还是纵向比较,比较的双方一定要有可比性,并且在同一个维度、粒度上去比较,要不是毫无意义的。

2、5W2H分析法

这个方法主要应用于用户行为研究和专项问题分析,从时间、地点、人物、事情、原因、方式、价格等7个方面对一个问题进行刻画研究。

3、SWOT

明确资源优势(Strengths)、竞争劣势(Weaknesses)、外部环境变化带来的机会(Opportunities)和威胁(Threats)等,将这些因素有机结合起来,以此确定企业经营战略。

4、PEST

从政治(Politics)、经济(Economics)、社会(Society)、技术(Technology)4个视角分析外部环境。

5、杜邦分析法

杜邦分析法是一种用来评价公司盈利能力和股东权益回报水平,从财务角度评价企业绩效的一种经典方法。其基本思想是将企业净资产收益率逐级分解为多项财务比率乘积,这样有助于深入分析比较企业经营业绩。

数据分析思维

分析思维是数据分析师最最核心的竞争力,上面所学习的python、sql、机器学习知识等都是在工具层面,要想使用好他们,还需要分析思维的驾驭。对于分析思维的学习,我建议新人也是从读书开始,我看过的且比较推荐的书包括:

  • 数据分析类

《精益数据分析》、《增长黑客》、《数据化管理:洞悉零售及电子商务运营》、《数据挖掘与数据化运营实战 思路、方法、技巧与应用》

  • 产品思维类,如果是想要从事互联网行业的数据分析师的话,产品思维也是必须要具备的,面试考察点之一

《从点子到产品:产品经理的价值观与方法论》、《俞军产品方法论》、《产品思维》

  • 逻辑思维类:在面试中逻辑清晰的回答面试官的问题,会为你大大的加分

《金字塔原理》、《学会提问》、《麦肯锡思维》

数据来源

数据是数据分析的基础,所以获取大而全的数据就至关重要,以下是我经常获取数据的几个渠道:

1、国家统计局:https://www.stats.gov.cn/,国家统计局网站上的数据量之齐全,内容之丰富,简直让人咂舌,可以作为你宏观数据分析的来源。

2、工信部:https://www.miit.gov.cn/,主要针对的是工业、信息类数据,上面还有一些行业运行情况分析,可以作为参考。

3、中国信通院:中国信息通信研究院针对互联网多个行业的发展趋势,会有很多行业白皮书发布,研究内容较为前沿。

4、艾瑞:https://www.iresearch.cn/,主要针对互联网行业,数据比较单一,亮点是会发布一些艾瑞研究报告,是开阔分析思路的好帮手。

5、网易、新浪等门户网站。这些网站的数据较为分散,需要进行整合,最好的方式就是配合爬虫筛选自己想要的数据。

最近我的数据分析课程已经开课了,感兴趣的朋友转发收藏本文,并在后台私信我“资料包”即可获得入群资格及10G的数据分析学习资料!

文中提到的书籍的电子版和数据分析工具下载方式,私信分别回复“书籍”“工具”可领取

(0)

相关推荐

  • 我在京东做数据分析,一位京东数据分析师的工作日常

    有人说:"种下一棵树最好的时间是十年前,其次是现在".任何时候,我们都应该抓住机遇,说不定就是改变你现状的一个机会. 2020年,我在疫情得到控制后,面试入职京东大数据组,截止目前 ...

  • 分析数据没有思路,如何提高数据分析思维?

    数据分析思维是通过各种方法收集用户的数据,了解用户需求,然后改进你的个人决策,不断迭代. 如何建立数据分析思维呢? 对于数据分析师来说,刚开始肯定是能做一些有趣的分析,但是长期做数据分析工作,想法总会 ...

  • 写给新手小白的数据分析初入门:从思维、方法到实践

    什么是数据分析? 很多人都没有搞懂数据分析是什么,包括一些公司和企业也没搞清楚数据分析的定义.经常听到有人说投了数据分析的岗位,结果入职之后每天干的活就是取数给业务用,感觉自己就像个取数机.这样的工作 ...

  • 新手作者不知道怎么写小说?——最全新人入门指南

    嗨~各位派友大家好. 距离上一次对新手入门内容进行整合是2019年7月份的时候了. 在后来的时间里,玄派又迎来了很多新派友,新写了很多新的内容. 今天,我们就对这一版本新人指南进行更新,希望可以帮助作 ...

  • 写给跑步小白的开跑指南(训练篇)

    五千米,操场最内道12.5圈,男子记录由贝克勒创造:12分37秒:那就给5千米跑下一个粗略的定义:一个至少要跑12分钟,身体移动轨迹达到5000米的运动. 12分钟,坐地铁上班好像不够,吃午餐排队也不 ...

  • 写给跑步小白的开跑指南(准备篇)

    你可能是一个想要开始跑步的人,如何开跑?你可能是一个大体重者,体重大,如何开跑?对于从未系统了解过跑步知识的新手,和容易受伤的大体重高体脂跑者,开始跑步前尝尝会面临这样的问题:如何跑步能有效减重?如何 ...

  • 【科普】写给新手们的夜视仪选购指南之一

    本帖最后由 教主sama 于 2020-1-31 20:50 编辑 随着水弹的发展,打击距离的增加,夜间下场成为可能.夜视仪可能不会成为夜场的标准装备,但是绝对能大幅度提升夜场的趣味性.选购夜视仪并不 ...

  • 新手抽烟斗的入门指南

    烟斗的选择 1,刚需 抽烟斗最好有多把烟斗轮换使用.因抽斗时烟气会在烟道降温冷却,从而冷凝结出水珠附着在烟道上,如果没被木头充分吸收掉,就形成了积水,再混杂上烟气里的烟油,散发出类似氨水味的恶臭,严重 ...

  • 数据分析新手小白入门学习指南,这五大知识清单值得收藏

    根据我从业这么多年的经验,如果为了尽快找到一份数据分析的工作,需要掌握三个核心的点: 数据分析基础(一定的数据思维.统计学基础和sql能力)--能做最基本的取数工作 数据分析能力(使用各种分析工具.套 ...

  • 隶书经典《曹全碑》入门指南,写的太绝了,新手必看!

    隸書作為壹種最為靈動和高古的字體,不少人由隸入門也是無可厚非.說起入門的隸書選擇,不少人第壹想到<曹全碑>,那麽曹全碑到底好在哪裏?今天書思就重點和大家說說. 1.<曹>字保持 ...

  • 新手入门指南 | 报告酱教你写研报

    前两周聊了一下如何读研报,如果你能多看多写,日积月累,水平当然也会慢慢提高. 最近还有小伙伴会问彤彤,如果自己写研报,要怎么下手?思路和框架是什么呢? 这个问题看上去有点泛,其实也不难回答.报告酱就来 ...