写给新手小白的数据分析初入门:从思维、方法到实践
什么是数据分析?
很多人都没有搞懂数据分析是什么,包括一些公司和企业也没搞清楚数据分析的定义。经常听到有人说投了数据分析的岗位,结果入职之后每天干的活就是取数给业务用,感觉自己就像个取数机。这样的工作根本不能叫做数据分析。
什么是数据分析,用我自己的话来说就是针对某个问题,将获取后的数据用分析手段加以处理,并发现业务价值的过程。这一句话也基本涵盖了数据分析的流程:目标确定——数据获取、清洗、整理——数据分析——结果呈现。
02数据分析都需要哪些能力呢?
数据分析师需要会哪些技能,围绕上面数据分析的基本流程,我把数据分析师的能力分为这样三大部分:基础知识、工具技能、分析方法与思维,以下是数据分析的技能大纲,图中标记了能力等级,大家根据自己的情况对应学习:
03数据分析基础知识
1)统计学
毫不夸张的说统计学是整个数据分析的灵魂,当然统计学是判别一个数据分析师强弱的一个重要方法就是,看他对统计规律的敏感度。如果同学们不是往数据分析师方向发展,简单了解下就可以了,但多了解一点对你的数据分析思维逻辑也是有很大帮助的。
统计学需要从基础的统计理论(描述性统计、区间估计、假设检验等)出发,到基本的统计分析(T 检验、方差分析等),最后到商业常用的模型(回归分析、方差分析等),学习数据分析背后的逻辑,掌握实用统计学的概念和会利用统计的思维去思考问题。
推荐书籍:
《深入浅出数据分析》李航
这本书非常推荐作为小白的入门书籍,特别是之前没有接触过数据分析的。特点和书名一样深入浅出,而且图多。里面没有那么多公式和理论,但其中对于统计的基本原理以及统计问题的来源场景介绍的非常通透,非常符合深入浅出系列定位。如果有之前有一定基础,建议略过。
2)机器学习
对于想要进阶成为高级数据分析师的朋友来说,就要掌握机器学习相关的知识:
- 特征工程的基础:如何统计数据特征、选用不同的特征,做模型的优化;
- 基本的分类算法:决策树、随机森林等;
- 基本的聚类算法、数据挖掘、常见的机器学习算法的了解等等
机器学习相关的知识学习成本会比较高,对某些同学来说可能会有一定难度,但对于业务型数据分析师来说,一般不会要求你去推导算法公式,能做到明白不同算法的适用场景、优缺点、原理大概懂就基本可以了。
接下来就要分享大部分同学感兴趣的数据分析的实用工具了。
04数据分析工具学习
1)PPT
为什么把PPT放在第一,原因很简单,我们做数据分析的目的是什么?当然是为了展示给客户、上级,供他们做决策。所以PPT作为主流汇报、展示工具,是将分析关键结果传递给其他的重要手段。学好PPT可以提升沟通和消息传递效率,也是数据分析师必备的技能,具体学习书目我就不做推荐了。
2)EXCEL
EXCEL应该是需要进行数据分析的同学以及数据分析师最常用的统计分析工具了,原因是因为方便,所见即所得,而且具有方便的可视化功能。应该说只有学会了Vlookup,数据透视和基本公式才算EXCEL入门,其次EXCEL最大的惊喜是数据可视化,拥有大量的图表模板,可以减轻我们很多工作。我们后续的课程也会有关于Excel在实际项目中的使用方法。
3)SQL
作为数据分析人员,要想获取数据,肯定就要和数据库打交道,因此SQL肯定是要掌握的,在招聘要求中,SQL也是很多数据分析岗位的能力要求之一。学习SQL最快的方法是能自己下载数据库管理工具,找些数据练习,主要了解一些数据库查询语言,where,group by,orderby,having,like,count,sum,min,max,distinct,if,join,left join,limit,and和or的逻辑,时间转换函数等。
4)Python
Python作为目前最火的编程软件之一,简单易学,零基础小白完全适用,而且在数据分析、数据挖掘上有着独特优势。在数据分析的过程中,Python扮演的角色是进行数据处理和数据展现的工具。比如针对数据表进行数据整理、关键数据提取、筛选目标数据、制作数据图表等。是否具备编程能力,也是初级数据分析和高级数据分析的分水岭。
本期体验课,也会教到同学们一些基础的python知识,但,课程不是单纯的教同学们学习python,而是用python这个工具去快速实现一个完整的项目的数据分析应该是如何进行的。这里再送给同学们一个python完整的学习路径,如果有同学想要完整的去学习python,可以参考此图。
05数据分析方法
学习数据分析肯定有人上网百度了不少数据分析方法,什么漏斗分析法,PEST,SWOT模型、杜邦分析法等等。并且由于不同版本的演绎,造成了分析方法种类繁多,令人眼花缭乱,关于分析方法值得一说的就是一定要结合行业特点,特别是对业务的掌握,这样才能事半功倍。下面简单列几个比较通用的分析方法:
1)对比分析法
对比分析法常用的基础分析方法,虽然方法特别简单,但几乎所有的分析报告中,都会采取对比分析方法。比如去年同期相比、上个月环比、目标和实际达成相比、各个部门和业务线相比、行业内竞品比较、营销效果对比,等等。这里需要注意的是我们不管是横向比较还是纵向比较,比较的双方一定要有可比性,并且在同一个维度、粒度上去比较,要不是毫无意义的。
2)5W2H分析法
这个方法主要应用于用户行为研究和专项问题分析,从时间、地点、人物、事情、原因、方式、价格等7个方面对一个问题进行刻画研究。
3)SWOT
明确资源优势(Strengths)、竞争劣势(Weaknesses)、外部环境变化带来的机会(Opportunities)和威胁(Threats)等,将这些因素有机结合起来,以此确定企业经营战略。
4)PEST
从政治(Politics)、经济(Economics)、社会(Society)、技术(Technology)4个视角分析外部环境。
5)杜邦分析法
杜邦分析法是一种用来评价公司盈利能力和股东权益回报水平,从财务角度评价企业绩效的一种经典方法。其基本思想是将企业净资产收益率逐级分解为多项财务比率乘积,这样有助于深入分析比较企业经营业绩。
06数据分析思维
分析思维是进行数据分析、专业数据分析师最最核心的竞争力,上面所学习的Python、SQL、机器学习知识等都是在工具层面,要想使用好他们,一定是需要分析思维的驾驭。对于分析思维的学习,很多同学会觉得不落地,不如学习一门工具来的实际,或者说我目前的工作不需要具备什么思维方法。
但老师要说,工具是执行者使用的利器,但思维绝对的管理者的标签,如果你不想一直做一个执行者去处理重复的工作,不想升职加薪,那可以忽略,但如果你想,那就要好好去培养数据分析思维,而这个也是我们体验课程的精华所在,所以好好去学习并理解这几天的课程内在,老师也推荐给同学们基本思维方面的书籍去做巩固。
- 《精益数据分析》
- 《增长黑客》
- 《数据化管理:洞悉零售及电子商务运营》
- 《数据挖掘与数据化运营实战思路、方法、技巧与应用》
逻辑思维类:在面试中逻辑清晰的回答面试官的问题,会为你大大的加分。
- 《金字塔原理》
- 《学会提问》
- 《麦肯锡思维》
好啦,今天的数据分析认知课,就到这里啦,希望同学们能够知道并了解什么是数据分析,并开始对数据分析产生了兴趣加油,努力学习吧!