阿里资深数据分析师回答那些关于数据分析师的最常见的几个问题
随着数据分析师这个岗位的兴起,越来越多的人想要转行入到这个行业中,但对于一个未知的行业还存在着许多不确定性,今天我们邀请到了阿里资深的数据分析师来为大家回答那些比较大多数人比较想问的常见问题。
你为何选择数据分析师这个职业?
我毕业进入腾讯,就从事数据相关的工作,刚开始做大数据主要是数据开发,也就是按需求做数据报表,基本不涉及数据分析;大概在 2014 年随着数据开发的成熟,个人也想在大数据方向上往前更进一步,同时产品同学对数据支持产品决策有了更高的要求,于是开始在数据分析上探索。
现在一线城市和二线城市的数据分析师真有像报告上所说的那么稀缺吗?现在的行情是怎样的呢?
目前『数据分析师』这个JOB 确实有缺口,为什么呢?这个由『数据分析师』本身工作特性决定:
『数据分析师』,『数据』+『分析』+『师』,这个意味着从业者需要懂『数据』,也要会『分析』,到了『师』的境界,说明有一定的经验积累。
一般的大学应届毕业生,大学里面没有类似的专业,懂计算机的不懂数据,懂数据的计算机技能差点,懂数据和计算机的逻辑性不好,最大的一个问题是,很多同学对于『定义问题』,『分析问题』,『思考问题』等基本的能力,都不具备,更别问『具体的市场,或者业务的分析和经验』,所以,应届毕业生中『统计学』专业的相对靠近『数据分析师』的基本技能,但是,也仅仅是技能上的靠近。
如果毕业以后不从事这个行业,以后想转行做这个行业,就相对困难一点,毕竟,『隔行如隔山』。另外,上面也侧面提到了,『数据分析师』需要具备很多技能,这个比JAVA开发工程师这样相对单一技能来说,要复杂一点,所以,这个也是『数据分析师』缺的一个原因。
另外,大数据火热的时间比较短,顶多3-5年左右。应届毕业生供求少,相应的从业人才比较少,又加上最近言必称数据,公司更是想尽办法跟大数据沾边,对于数据人才需求量大。尤其是互联网公司的发展太快,互联网公司对于数据人才的需求更大。储备少 VS 需求大,自然就有缺口了。
目前数据分析的行情,不同的公司和职位有不同的情况,大概介于『运营、产品』和『开发』之间吧。
你最擅长的一门分析工具是哪个,为什么选择它?
做数据分析平时用的最多的是 SQL+EXCEL,在大公司做数据分析,这两个工具用好基本能满足 80%的分析,剩下的 20%看具体需求再选择相应的工具;
小数据量建模或者可视化可以选择 python、R,更推荐 python,可用的包更多更方便,不想写代码的可以用 spss、sas 建模,Tableau 做可视化;大数据量建模用 spark+scala;社区分析可以用 gephi。
SQL 在数据分析工作很重要吗?常用的 SQL 工具有哪些呢?
SQL主要是用来做数据提取的。目前公司的数据,很多都放在数据库,比如MySQL,mangoDB,等等;如果是ODPS,HIVE,也是sql提取,所以,这种情况让别人觉得SQL很重要。其实,SQL也是一个技能。
我们做数据分析,必须要把数据提取出来,这个是第一步。提取出来以后,再分析,是第二步。其实,在阿里巴巴这么高大上的公司,一个分析师会SQL+EXCEL+PPT,基本就可以把活干完了。 所以,只要会SQL的基本语法,会写SQL代码,写个1W行,基本SQL就不是问题了。
你觉得什么人适合从事数据分析工作?
这个不好下绝对定论,我觉得你只要对数据感兴趣就可以从事数据分析工作,未来数据分析应该是各行各业需要具备的基础技能,就像大家现在都会使用电脑办公一样。
数据分析从入门到进阶的路线是什么?核心技能是什么呢?至少要懂那些东西才能上手干活?
说到『从入门到进阶的路线』,我个人觉得没有一个明确和固定的路线,不像JAVA,从看《think in java》开始,到《如何治疗颈椎病》结束。每个人都会『分析』,都有想法,也都有自己的『看法』。
数据挖掘和数据分析的区别是什么呢?做数据分析一定要懂数据挖掘吗?需要懂到什么程度呢?
数据分析和数据挖掘,广义的『数据分析』包括了数据挖掘,狭义的说呢,它们的目的一样,都是挖掘数据的价值,但是过程和方法不一样。『数据挖掘』偏重研究数据中的规律和模式,规律、模式一定要通过工具来挖掘;
『数据分析』一般分析目标相对明确,从数据得到一些信息,不用那么深的规律的探讨。做数据分析,不一定非要懂那么多数据挖掘的算法,或者机器学习。当然,技多不压身,懂的东西越多越好。至于具体的一个『业务问题』的分析,一般不会涉及到复杂的『数据挖掘』,统计方法就够了。
你觉得优秀的数据分析师应该具备什么素质和技能?
1)业务问题转化能力:将业务问题转化为数据问题,如“评估产品是否健康”、“一款直播产品要不要做短视频运营”等,这些问题都是产品问题或者运营问题,需要进一步将其转化为数据问题才能分析,一个好的业务问题是数据分析的关键,需要通过深入理解业务再加上自己的思考才有这样的思维。
2)数据敏感度:看到的数据不仅是数字本身,而是对应的产品经营状况度量;数据敏感度不是短期内就能立即提升的,需要长期看数据并结合业务逻辑思考,才能逐步具备数据敏感度。
3)逻辑推理能力:做数据分析很像数学证明题,通常是先有假设,再通过一系列数字证据,来证明假设或者推翻假设,所以需要具备一定的逻辑推理,可以通过阅读别人的分析报告,学习已有的推理方式来获得技能。
4)推动策略落地:这是做数据分析至关重要的环节,没有落地的数据分析都是无用功;在公司内大部分情况是跟产品经理协作完成,为了保证策略能够落地,做到两点很重要:策略要在业务当前的关键路径上;策略需要分解到小团队或者个人。
5)基本分析工具:这是分析的基础,在上面的问题中有提到,这里不赘述。
文章来源:网络 版权归原作者所有
上文内容不用于商业目的,如涉及知识产权问题,请权利人联系小编,我们将立即处理