数据科学导论

  • 内容简介:

  • 《数据科学导论(面向新工科专业建设计算机系列教材)》主要介绍数据科学的通识入门知识,可以作为高等院校数据科学与大数据专业的专业基础课程教材。该书以“建立知识体系、掌握基本原理、学会初级实践、了解前沿技术”为原则,为数据科学与大数据及相关专业的学生深入学习数据科学和大数据技术奠定基础。该书系统讲授数据科学的基本概念和知识体系、数据分析的基本流程和方法(包括数据预处理、回归、聚类、分类等智能分析技术)、大数据分析的基本T具,并以Python语言为例,通过大量实例和练习讲授初级的数据分析技术。该书通过系统全面的理论介绍与丰富翔实的程序实践相结合,帮助数据科学与大数据及相关专业的学生树立大数据意识,学习数据科学的知识体系,掌握基本的数据处理方法。

    《数据科学导论(面向新工科专业建设计算机系列教材)》适合作为数据科学与大数据及相关专业学生的教材,也可作为大数据开发工程师的参考书。

  • 作者简介:

  • 石川,北京邮电大学教授、博士生导师。长期从事计算机专业基础课程教学工作,参与多项教改项目。主要研究方向为数据挖掘和机器学习,发表高水平学术论文100余篇,中英文专著3部,成果应用于IT企业。研究成果获得省部级奖励3项,本人获得北京市高等学校青年英才和师德先锋等称号。

    王啸,北京邮电大学讲师、硕士生导师。天津大学博士,圣路易斯华盛顿大学联培博士,清华大学博士后,主要研究方向为数据挖掘与机器学习,曾主持国家自然科学基金项目,发表高水平论文50余篇,获得微软亚洲研究院“铸星计划”支持。

    胡琳梅,北京邮电大学副教授,硕士生导师。清华大学博士,北京市优秀毕业生。主要研究方向为自然语言处理与知识图谱,获2019年微软亚洲研究院“铸星计划”支持。

  • 目录:

  • 第1章 数据科学概论
    1.1 数据和大数据
    1.1.1 数据
    1.1.2 数据化进程
    1.1.3 大数据
    1.2 数据科学理论基础
    1.2.1 数据科学发展历程
    1.2.2 数据科学的概念
    1.2.3 数据科学的主要内容
    1.3 数据科学应用实践
    1.3.1 数据科学家
    1.3.2 数据科学工作流程
    1.3.3 数据科学实践案例
    1.4 小结
    1.4.1 本章总结
    1.4.2 扩展阅读材料
    1.5 习题
    1.6 参考资料

    第2章 数学基础
    2.1 线性代数
    2.1.1 向量
    2.1.2 矩阵
    2.1.3 矩阵导数
    2.1.4 实例:利用SVD进行评分预测
    2.2 概率统计
    2.2.1 随机事件与概率
    2.2.2 条件概率与事件独立性
    2.2.3 随机变量及其数字特征
    2.2.4 数理统计
    2.2.5 信息论
    2.2.6 实例:利用朴素贝叶斯算法进行文本分类
    2.3 优化理论
    2.3.1 基本概念
    2.3.2 优化问题的一般形式
    2.3.3 优化方法
    2.3.4 实例:SVM分类器
    2.4 图论基础
    2.4.1 图的定义
    2.4.2 图的概念
    2.4.3 图的矩阵表示
    2.4.4 拉普拉斯矩阵与谱
    2.4.5 实例:谱聚类算法
    2.5 小结
    2.5.1 本章总结
    2.5.2 扩展阅读材料
    2.6 习题
    2.7 参考资料

    第3章 Python语言初步
    3.1 Python语言概述
    3.1.1 Python语言简介
    3.1.2 Python语言环境搭建
    3.2 Python的基本用法
    3.2.1 列表与元组
    3.2.2 字符串
    3.2.3 字典
    3.2.4 条件与循环语句
    3.2.5 函数
    3.2.6 文件
    3.2.7 综合实例
    3.3 重要库的使用方法与案例
    3.3.1 NumPy
    3.3.2 Pandas
    3.3.3 SciPy
    3.3.4 Matplotlib
    ……
    第4章 数据预处理
    第5章 分析方法初步
    第6章 数据科学实践
    第7章 数据科学的重要研究领域
    第8章 大数据处理技术简介

(0)

相关推荐

  • 推荐给计算机新生的书籍(开学党必备)

    本篇文章按先修课.专业基础课.专业选修课为大家进行推荐,由于篇幅有限,不能涵盖所有专业领域奥. 数据库 <SQL必知必会(第5版)> <MySQL必知必会> <SQL基础 ...

  • 性能度量RMSE

    回归问题的典型性能度量是均方根误差(RMSE:Root Mean Square Error).如下公式. m为是你计算RMSE的数据集中instance的数量. x(i)是第i个实例的特征值向量 ,y ...

  • 大数据时代,哪些美国大学开设了高薪又缺人的数据科学专业?

    进入大数据时代,人们对数据的关注可谓前所未有,越来越多的人投身于研究.分析数据,并把数据作为重要的决策参考依据.数据科学(Data science)在这样的时代背景下逐步成为火热的专业. 根据Glas ...

  • 每周一书《算法导论》分享!

    内容简介 在有关算法的书中,有一些叙述非常严谨,但不够全面:另一些涉及了大量的题材,但又缺乏严谨性.本书将严谨性和全面性融为一体,深入讨论各类算法,并着力使这些算法的设计和分析能为各个层次的读者接受. ...

  • Python常用科学计算库有哪些?

    大家都知道,编程语言有很多,其中包括Python.Java.PHP等.对比其他编程语言来讲,Python具有非常独特的优势,它拥有很多第三方库,可应用于各大领域,比如人工智能.科学计算.那么Pytho ...

  • 媒介技术视野下数据科学与媒介研究的新进展

    作者:徐婧 马晓悦 来源<西安交通大学学报(社会科学版)>2020年第3期 摘要 随着数据科学持续深入地嵌入到日常社会生活,对数据科学与人文社会科学各学科的交叉融合的讨论已成为学界关注的焦 ...

  • 机工社 | 数据科学与大数据精品教材专题

    /01 /02 样书获取方式 1. 登陆机工教育服务网(www.cmpedu.com)注册教师会员自助申请:

  • 计算机科学与技术与数据科学与大数据专业有什么区别?

    2020年全国共有960余所本科院校开设计算机科学与技术专业,510余所本科院校开设数据科学与大数据技术专业.虽然计算机科学与技术和数据科学与大数据技术同属于计算机类专业,但是两者的培养模式和培养目标 ...

  • 强烈推荐,B站最强学习资源汇总(数据科学,机器学习,python)

    经过这几个月的居家隔离,想必大多数同学都开始习惯通过线上的方式开展学习了,在线教育领域也因此迎来了一波爆发,竞争异常激烈,既有知名平台如MOOC.学堂在线.网易云课堂等,也有不少初创新星.但要说最受年 ...

  • 数据科学领域全景

    入门尝试在复杂领域中提供结构和参考点 1.介绍 数据是21世纪的新石油-信息时代. 这种表述概括了这样一个事实,即从数据中提取洞察力对于大多数企业而言已变得至关重要.这种趋势是数据科学快速增长的根本驱 ...

  • 厦门大学统计学与数据科学学科建设研讨会暨统计系更名仪式举行

    4月24日,2021年厦门大学统计学与数据科学学科建设研讨会暨统计系更名仪式在厦大经济楼举行.来自国内外三十余所知名高校和相关机构的专家学者莅临参会.围绕统计学与数据科学学科建设,参会者共同交流学科发 ...

  • Python数据科学常见模块!

    Python在数据科学和人工智能领域非常流行,而且它有很多不同的模块,可以帮助工作人员轻松的完成工作,提高效率.但很多人对Python数据科学及人工智能的模块并不了解,接下来我们通过这篇文章为大家详细 ...

  • 数据科学总纲—数据分析师必看

    大家好,我是ZZ,目前在网易担任数据分析师.欢迎大家来到我的个人频道. 创建这个频道主要有三个目的: 一是将自己多年来对数据科学知识的一点理解进行总结,并且以通俗易懂的语言呈现给读者,以便大家学习. ...

  • 新工科、新医科、新农科、新文科专业建设下的数据科学教育 教育资讯

    新一轮科技革命和产业变革正在引发世界格局的深刻调整,将会重塑国家竞争力在全球的位置,重构人们的生活.学习和思维方式.高等教育,作为给国家经济社会发展输送高素质人才的主渠道,如何才能不滞后于时代?成为近 ...