【每周一本书】之《数据可视化与数据挖掘》:基于Tableau和SPSS Modeler图形界面

数据猿导读】 大数据时代正在改变着我们的生活、工作和思维,要让大数据发挥出最大价值,最重要的手段就是进行数据可视化挖掘。利用可视化数据挖掘工具和技术,分析人员能够从全新的角度快速、轻松地挖掘信息。

编辑 | abby

官网 | www.datayuan.cn

微信公众号ID | datayuancn

当前,经典的数据挖掘算法日趋成熟,相关标准和技术已经在各行各业得到广泛应用。为了使数据挖掘技术满足不同层次用户的需要,可视化数据挖掘技术被提出,通过可视化的手段将数据挖掘过程的各个阶段展示给用户,使用户能更好地理解过程,目前该技术已经成为数据挖掘领域的研究热点。

今天小编为大家推荐的《数据可视化与数据挖掘——基于Tableau和SPSS Modeler图形界面》就旨在为读者介绍最新的可视化数据挖掘技术。本书内容主要基于 Tableau 10.3和 IBM SPSS Modeler 18.0 编写,详细介绍了 Tableau 的数据连接、图形编辑、创建地图、表计算和聚合计算等功能,以及 IBM SPSS Modeler 的数据连接、CRISP-DM(跨行业数据挖掘标准流程)等功能。通过实际案例,重点介绍了可视化数据挖掘技术在电信、电力、医药、银行、电商和房地产等行业中的应用,可以作为互联网、银行证券、电商等行业的从业者,以及高等院校相关专业学生参考使用。

大数据时代正在改变着我们的生活、工作和思维,要让大数据发挥出最大价值,最重要的手段就是进行数据可视化挖掘。利用可视化数据挖掘工具和技术,分析人员能够从全新的角度快速、轻松地挖掘信息。可视化数据挖掘使数据挖掘变得更简单,建模过程不需要编写代码,非技术出身的业务人员等也可以利用数据做出决策。

本书从内容方面主要分为15个章节:

第1章:介绍数据可视化和可视化数据挖掘的基本理论及主要软件,前者包括Tableau、QlikView和Power BI,后者包括IBM SPSS Modeler、Intelligent Miner和SAS Enterprise Miner。

第2章:介绍Tableau Desktop 10.3软件简介、数据类型、运算符及优先级、软件的安装与激活和Tableau的文件类型等。

第3章:介绍Tableau Desktop可以连接的数据源,包括Excel文件、文本文件、Access文件、JSON文件、PDF文件、空间文件和统计文件等,还介绍了如何连接各类数据库,如Tableau Server、SQL Server、MySQL和Oracle等。

第4章:首先介绍Tableau Desktop的维度和度量、连续和离散的概念和操作,然后介绍工作区和工作表的基础操作,最后详细介绍表计算、创建字段、创建参数和聚合计算等高级操作。

第5章:介绍如何使用Tableau生成一些统计图形,如条形图、饼图、直方图、折线图、散点图、并排图、甘特图等。

第6章:介绍IBM SPSS Modeler的发展历史、软件特点、软件算法、软件功能、安装过程和授权许可等。

第7章:介绍使用IBM SPSS Modeler进行数据挖掘的6个基本步骤:业务理解、数据理解、数据准备、建立模型、评估模型和应用模型。

第8章:介绍IBM SPSS Modeler的基本操作,包括连接到文件和连接到数据库,前者包括Excel文件、SAS文件、SPSS Statistics文件、变量文件和固定文件等,后者包括Oracle、SQL Server、DB2、MySQL等数据库。

第9章:介绍IBM SPSS Modeler的数据流操作,包括生成数据流、添加和删除节点、连接数据流、修改连接节点和执行数据流等。

第10章:介绍可视化数据挖掘在电信行业中的应用,根据客户流失数据,运用Logistic回归算法,建立了基于客户属性、服务属性和客户消费信息的客户流失预警模型。

第11章:介绍可视化数据挖掘在电力行业中的应用,由于用电负荷具有季节性和周期性的特点,因此运用时间序列模型,同时选择时间序列中的专家建模器进行建模。

第12章:介绍可视化数据挖掘在医药行业中的应用,根据患者的用药数据,应用K-Means聚类算法,建立基于药物在人体的类胆固醇TC、Na、Ka等因素的药物效果聚类模型。

第13章:介绍可视化数据挖掘在银行业中的应用,根据银行客户的登记记录数据,运用判别分析算法,建立基于客户的属性数据、信用等级和资产状况等因素的客户类型判别模型。

第14章:介绍可视化数据挖掘在电商行业中的应用,根据促销的费用、促销前的销售额和促销后的销售额等数据,运用神经网络模型,建立基于促销费用、促销前的销售额和促销后的销售额等因素的促销效果评价模型。

第15章:介绍可视化数据挖掘在房地产行业中的应用,根据购房者的个人信息数据等,运用CHAID决策树算法,建立基于年龄、性别、学历、月薪和家庭人数等因素的购房决策树模型。

适度人群

本书的内容和案例适用于互联网、银行证券、电商、医药等行业数据分析用户进行可视化数据挖掘,可供高等院校相关专业学生及从事可视化数据挖掘的研究人员参考使用,也可作为Tableau和IBM SPSS Modeler软件培训和自学的教材。

(0)

相关推荐