超级菜鸟怎么学习数据分析?

如果你有python入门基础,在考虑数据分析岗,这篇文章将带你了解:数据分析人才的薪资水平,数据人应该掌握的技术栈。

那各大厂在数据领域,偏好哪些岗位呢?

主要集中在大数据分析师、数据管理专家、大数据算法工程师、数据产品经理这些岗位,在各个大厂的招聘需求中最常见到,而且开出的薪资待遇非常诱人。

如今大数据工程师人才高度稀缺,在工作年限相同的前提下,大数据工程师的薪资普遍更高,待遇涨幅也高于其他岗位,现在入局大数据,是个不错的选择。

各大互联网公司都在高价抢夺数据人才,为了谋求长期发展、获取高薪,很多人也在考虑转行大数据领域。作为专业性极强的一个领域,转行如何学?学习重点在哪里?

我很早之前就认同一个观点:一个优秀的数据人应该是思维、业务、分析和工程能力的综合体,谈思维、业务等能力很多人可能觉得飘在空中。确实,在我一开始接触数据行业的时候,我也有这样的感觉,为什么那些大佬老是跟我吹产品Sense、业务感等等。

我们就抛开这些,就说工程能力,再具体一点,说说数据人应该掌握的技术栈。

1.关于精通python

虽然入行几年,但我仍不敢说自己精通Pytho。我只是熟悉Python语法,相关的函数、模块和包以及一些面向对象的写法等等。

想要成为合格的数据人,我觉得更重要的是去思考哪些问题可以利用Python扩展而来的一些程序库处理,比如遇到大型矩阵的数值计算问题,你就应该想到Numpy来解决。

同理我会问,那Pandas呢?其实Pandas和SQL几乎是一致的数据处理方式,都只是提供了快速便捷地处理数据的函数和方法,这也是Python为什么会经常会被认为可以高效应用于数据分析原因之一了。

2.再说下数据架构

有些小伙伴应该是了解HiveSQL的,但如果要他说说Hive这类的问题,可能就有困难了,这样其实是学不扎实的表现。

简单来说,Hive是一个基于Hadoop的开源数据仓库工具,用于存(HDFS)和处理(MapReduce)海量结构化数据。使用MapReduce计算,HDFS储存。

虽然很多数据分析岗位不必精通Hadoop、MapReduce、HDFS,但是不代表不需要了解和学习,基础是要打好的,而且Storm、Hbase、Flume、Spark、SparkSQL等等都是需要数据分析、数据挖掘、数据算法等岗位去学习和了解的。

如果你想从事数据开发,那以上提到的技术栈是你应该熟练掌握的。(我个人建议是没有项目经历和工作经验的不要轻易转数据分析,因为真的HC少,可以考虑数据开发,很吃香,工资也高,竞争相对算法和分析来说要小)

3.有必要学点数据挖掘模型

某些业务场景的任务是不能用对比、交叉等分析解决的,例如分类、预测、文本挖掘等。

我之前提到说数据分析一般可以分成定量和定性的分析,定量的大家都比较清楚,也比较常见,但是定性的会去研究用户的主动反馈意见,而这些一般都是文本,当数据量较大的时候,肯定不是一条条自己去分析用户的情感、观点等维度,这时候完全可以利用文本挖掘的方法快速准确的抽取出用户观点、主题和情感分析等等。

看到现在越来越多的人入行/转行互联网,我来说说我对这个领域的理解吧。

从业人员(除了高层)一般年龄在45岁以下,思维活跃、年轻,不像传统行业等级森严,工作起来是比较愉悦的。任何人能入行这个领域,是因为互联网对于没有资源和背景的普通人是很包容的,比如它创造的很多新的工作机会,有些岗位之前是没有的,因此不强求专业对口、要多少年的经验等等,对于没有资历的普通人来说,互联网很友好。

最重要的一点是,互联网行业能和你适合的行业相结合,比如互联网+金融、互联网+餐饮,互联网成为了一种业务模式,贯穿到了很多行业,在此基础上去赚钱。

未来,互联网会越来越渗透到各个行业,未来10年也必定是人工智能、万物互联的时代。这也是我为什么看准python的原因,因为python的优势,就是对数据的处理。如果你也跟我一样看好互联网,看准python,那就利用好现在的时间,有效率的学习。我一直相信,生活会回报每一个为目标努力的人。

(0)

相关推荐

  • Python数据分析常用工具有哪些?工具合集!

    在我们的生活中,Python语言可谓是无处不在,能够应用在各大领域之中,比如说数据分析师,Python在数据分析领域有着非常不错的表现,想要从事数据分析师,掌握Python是非常有必要的.接下来为大家 ...

  • 大数据快速入门干货

    大数据时代 "大数据"这个人造词汇其实很容易产生不少误解,尤其是这个"大"字,很容易让人感觉,数据量必须大,而且特别大,越大越能形成产业,也越有价值. 做个假设 ...

  • python菜鸟教程学习12:输入输出

    Python两种输出值的方式: 表达式语句 print()函数 文件对象的 write() 方法,标准输出文件可以用 sys.stdout 引用. 如果你希望输出的形式更加多样,可以使用 str.fo ...

  • python菜鸟教程学习11:模块

    如果你从 Python 解释器退出再进入,那么你定义的所有的方法和变量就都消失了.为此 Python 提供了一个办法,把这些定义存放在文件中,为一些脚本或者交互式的解释器实例使用,这个文件被称为模块. ...

  • python菜鸟教程学习10:数据结构

    列表方法 list.append(x):把一个元素添加到列表的结尾,相当于 a[len(a):] = [x]. list.extend(L):通过添加指定列表的所有元素来扩充列表,相当于 a[len( ...

  • 从0开始学习数据分析(一)

    作者介绍 @爱丽丝 一个想转数据分析的测试, 希望大佬们多多指教. 0 前言 近期,通过看书的方式在从0开始学习数据分析,以下是通过读书所了解到的一些数据分析基础知识. 1 什么是数据分析? 字面上的 ...

  • python菜鸟教程学习9:函数

    函数的定义 函数是组织好的,可重复使用的,用来实现单一,或相关联功能的代码段.python提供了很多内建函数,但我们依然可以自己创建函数,叫做用户自定义函数. 自定义函数 你可以定义一个由自己想要功能 ...

  • python菜鸟教程学习8:迭代器与生成器

    迭代器 python最强大的功能之一,访问集合元素的一种方式.迭代器是一个可以记住遍历的位置的对象,迭代器对象从集合的第一个元素开始访问,直到所有的元素被访问完结束,迭代器只能往前不会后退. 迭代器有 ...

  • “食管超级微创手术”学习笔记(2020年浙江全国食管疾病学术大会)

    2020年11月13日-11月15日,2020 全国食管疾病学术大会暨浙江国际超声内镜学术大会.暨第四届"西湖论镜"消化内镜新技术4E论坛.暨第五届浙大一院肝胆胰疾病ERCP诊治西 ...

  • SimilarWeb 插件下载和使用(一款超级好用的数据分析工具) | 技术拉近你我!

    2SimilarWeb 插件下载和使用(一款超级好用的数据分析工具)Posted by 撒得一地 on 2018年3月22日 inChrome插件,杂谈上一篇:突破百度网盘限速的几种方法下一篇:推荐几 ...

  • ★【超级重要的学习原理底层逻辑】★大脑记忆力最强的学习法,爱因斯坦:我靠这个方法成为科学家

    关于学习法,我会不厌其烦的把它讲透,讲明白,讲易懂,力求大家彻底掌握它的本质,这似乎看起来有些唠叨,但是这完全有必要,它是我们今天这个知识时代获取有效知识的前提,没有一个有效学习法,你几乎不可能真正跟 ...