进入大数据时代,人们对数据的关注可谓前所未有,越来越多的人投身于研究、分析数据,并把数据作为重要的决策参考依据。数据科学(Data science)在这样的时代背景下逐步成为火热的专业。根据Glassdoor的最新排名,在2019年《美国50最佳工作》中,数据科学家是薪资最高的工作,基本年薪中位数为108,000美元/年。那么,数据科学到底是一个什么样的专业?美国有哪些好大学提供相关的本科课程呢?数据科学就是挖掘、分析数据,并获取数据中潜在信息,主要学习数学、统计以及一些算法和数据结构之类的计算机课程,是一门交叉的学科。主要通过利用预测因果分析、规范性分析和机器学习,来用于决策和预测。
比如说,如果从事信用贷款,那么客户是否能按时支付未来的信用贷款,就是你需要考虑的问题。在这里,你可以构建一个模型,该模型可以对客户的付款历史进行预测分析,以预测未来的付款是否准时。而这就是预测因果分析(Predictive causal analytics),即通过对历史数据进行建模,对未知情况和状况进行准确的预测。又比如说,谷歌的自动驾驶汽车。车辆收集的数据可以用来训练自动驾驶汽车。你可以对这些数据运行算法,使它变得智能。这将使你的汽车作出决定,如何时转弯,走哪条路,何时减速或加速。这就是规范性分析(Prescriptive analytics),即通过模拟和优化等找出最佳商业决策。在就业方向上,数据科学是不仅限于一个行业或研究领域的。它已被证明在医疗保健,能源,经济学,刑事司法以及市场营销等领域具有重要价值。因此,你只要有数据科学这项技能傍身,就可以行遍天下各个行业。正因处在大数据的时代,这一岗位的需求也开始呈现井喷式的增长。《哈佛商业评论》的一篇文章里将数据科学称作“21世纪最热门的职业”。目前,数据科学专业人才有着巨大的市场需求和人才缺口。据麦肯锡全球研究院的报告“Big data: The next frontier for innovation, competition, and productivity”说,“到2019年,能够利用大数据来分析业务和经营管理的人缺口巨大,仅美国就将面临15万以上数据分析师和150万数据管理人才的短缺。并且,据New Vantage Partners公司对《财富》美国500强公司的调查显示,85%的500强企业要么已经推出了大数据项目,要么正打算推出。未来几年他们花在数据分析上的投资将平均上涨40%。 现在美国市场中有很多data science相关的职位,雇主愿意接受没有工作经验的应届生,并且提供绿卡。这一点对我们国际生来说,还是非常非常重要的。面对这么一个就业面积广又高薪的专业。学姐今天就来为想去美国读数据科学专业的同学来推荐一波学校(主要是本科项目),有的是仅提供辅修,有的是Certificate Program,有的是 concentration项目,有的是 Data Science方向。主修(Major)与辅修(Minor)的区别:主要是课程数量。一般来说,一个专业通常需要10到16门数据科学课程才能获得学位,而辅修专业通常只需要4到6门。
哈佛大学(Degree track within Statistics Major)
https://statistics.fas.harvard.edu/degree-tracks哈佛大学共有50个本科专业,开设近3,900门本科课程。许多专业属于跨学科的交叉性专业。而数据科学项目,它是哈佛大学统计学本科学位里的其中一个方向。
芝加哥大学(Minor)
http://collegecatalog.uchicago.edu/thecollege/datascience/芝加哥大学位于美国伊利诺伊州的芝加哥,是一所顶尖的私立研究型大学,以经济学、物理学和社会学久负盛名。芝加哥大学的数据科学辅修课程针对所有学科的学生,课程包括了四门必修课和两门选修课。必修课包括数据科学导论i、数据科学导论ii、机器学习的数学基础、伦理、数据和隐私。该项目要求学生拥有一定的数学及编程基础,建议同学们在入学前能够熟练掌握一些编程语言,最好学过微积分、线性代数、计算机编程等课程,否则学业压力会很大。
A. Core Probability and Statistics(核心概率与统计)
B. Computational Skills(计算技能)
C. Methods of Data Science(数据科学方法)
D. Mathematical Foundations and Theory(数学基础与理论)
E. Efficient Computation and Big Data(高效计算与大数据)
F. Data Science in Context(Context中的数据科学)
G. Methods in Application Areas(应用领域的方法)
哥伦比亚大学(Certificate Program)
https://datascience.columbia.edu/certification
这项数据科学认证由工程与应用科学院校TheFU基金会与哥伦比亚大学艺术与科学研究生院共同建立。非学位兼职课程数据科学专业成就证书的候选人必须完成至少12个学分,其中包括四门必修课程:
https://stat.mit.edu/academics/minor-in-statistics/麻省理工学院统计与数据科学的辅修课程对任何专业的本科生都开放。统计与数据科学辅修课程的重点是为学生提供统计、概率和计算方面的工作知识库,以及进行数据分析的能力。选择该课程项目的同学需通过六门必修课程。https://exploredegrees.stanford.edu/schoolofhumanitiesandsciences/statistics/#minortext斯坦福大学(Stanford University)——永远在追逐最前沿知识的研究型大学。斯坦福的本科数据科学辅修课程是为人文和社会科学专业的学生设计的,他们希望获得与他们的兴趣领域相关的统计数据分析方法的实践知识,不需要有编程或统计背景。6. 数据挖掘与分析(Data Mining and Analysis)7. 选修任意1门符合相关领域的数据科学方法论的课程(Elective Course)https://www.hmc.edu/academics/majors-at-harvey-mudd/哈维穆德学院是美国一所专攻STEM的文理学院,该校只有七大专业:生物、化学、计算机科学、工程、数学、物理、数学及计算生物学。此外还有三个联合双专业项目。常见雇主是微软、Yelp、脸书、苹果和军工企业诺斯洛普·格鲁门公司等。录取率通常低于15%,难度直逼藤校。总之,对哈维·穆德学院感兴趣的学生一定要具有一定的数学和科学的才能。https://www.statistics.northwestern.edu/undergraduate/major.html西北大学坐落于伊利诺伊州东北部城市埃文斯顿,是一所世界顶尖的私立研究型大学,是十大联盟(Big Ten Conference)创始成员和北美顶尖大学学术联盟美国大学协会(AAU)的成员之一。
◈ 辅修课程需要完成6门课程:
1. 导论课,包括:统计学导论 Introduction to Statistics/社会科学导论统计学 Introductory Statistics for the Social Sciences /应用统计学 Applied Statistics, or approved introductory statistics/微积分 calculus /计算机科学课程 computer science course;
2. STAT 301-1 数据科学1;
3. STAT 301-2 数据科学2;
4. STAT 301-3 数据科学3;
5. STAT 302 数据可视化;
6. 与辅修课程相关的选修课1门;
卡内基梅隆大学(Majors in Statistics combined with Economics/Machine Learning)
http://coursecatalog.web.cmu.edu/schools-colleges/dietrichcollegeofhumanitiesandsocialsciences/departmentofstatistics/
卡耐基梅隆大学统计与数据科学系以其在统计理论与实践方面的贡献而闻名于世。该系的研究涵盖了从纯数学到最热门的科学前沿的各个领域。卡内基梅隆大学(Carnegie Mellon)的统计学专业学生已经在许多领域的领先企业找到了工作,包括:美国国家经济研究协会(National Economic Research Association)、波音(Boeing)、摩根士丹利(Morgan Stanley)、德勤(Deloitte)、罗塞塔营销集团(Rosetta Marketing Group)、尼尔森(Nielsen)、宝洁(Proctor and Gamble)、埃森哲(Accenture)和高盛(Goldman Sachs)。
1.数学基础(Mathematical Foundations)
2.数据分析(Date Analysis)
3.概率论与统计理论(Probability Theory And Statisical Theory)
4.统计计算(Statistical Computing)
5.机器学习/计算机科学(Machine Learning/Computer Science)
https://catalog.upenn.edu/undergraduate/programs/data-science-minor/宾夕法尼亚大学(University of Pennsylvania)是美国第一所现代意义上的大学。身背Ivy的标签,宾大可谓不负众望。不仅美国,北美洲的第一所医学院,第一所商学院,第一所传媒学院以及第一个学生会组织都诞生于宾夕法尼亚大学。◈ 数据科学辅修课的核心课程要求(Core Requirements)是:
1.Programming Languages and Techniques I;
2.Applied Machine Learning 2/Modern Data
3.Mining/Machine Learning(任选1门);
4.Scalable and Cloud Computing/Big Data
5.Analytics(任选1门);
6.Engineering Statistics/Statistics for Data
7.Science/Statistical Inference(任选1门)
康奈尔大学(Concentration within Information Science)
https://infosci.cornell.edu/undergraduate/info-sci-majors/bs-information-science-cals/degree-requirements/concentrations/data康奈尔大学(Cornell University)作为八所藤校中的新起之秀,其理科实力也是有目共睹的。截止2018年,康奈尔大学的校友或教研人员荣获诺贝尔奖,在全球高校中,位列第十二位。值得一提的是,它还是所有藤校中录取中国学生最多的学校。关于数据科学课程要求是需要在指定领域里,各完成一门课程,包括:A.数据分析 Data Analysis(选择1项)B.领域专长 Domain Expertise(选择1项)C.大数据伦理,政策和社会 Big Data Ethics, Policy and Society(选择1项)D.数据通信 Data Communication(选择1项)值得注意的一点是,大家在选校时不要只看 Data Science名字,而要看大学的具体课程设置,有的学校可能是叫 Data Analytics、Data Studies等。此外,提供数据科学专业/辅修课程的美国大学还有很多,包括:UC伯克利;布朗大学;杜克大学;东北大学(Northeastern University);普渡大学(Purdue University);杨百翰大学(Brigham Young University);凯斯西储大学(Case Western Reserve University);查尔斯顿学院(College of Charleston);科罗拉多州立大学(Colorado State University);宾夕法尼亚州立大学(Pennsylvania State University);伯特利大学(Bethel University)等等。并且许多学校的应用数据科学的辅修课程是对任何本科专业都是开放的,没有专业背景的限制。总之,相对而言,Data Science 算是一个相当新的领域,虽然“大数据”时代的概念已经有些年头,但对于DS来讲,未来依旧很光明。无论是从finance, energy, travel, 还是到government,都应用到了这个学科。更重要的是,很多大学都已经意识到了开设这个领域的课程和项目的重要性。从Columbia University到MIT,还有UC Berkeley和NYU新的研究生项目都给学生增加了很多机会可以学习这个领域的课程以及发展职业。