数据仓库与数据挖掘(第二版)/21世纪高等学校计算机专业核心课程规划教材

  • 目录:

  • 第1章数据仓库的概念与体系结构

    1.1数据仓库的概念、特点与组成

    1.1.1数据仓库的特点

    1.1.2数据仓库的组成

    1.2数据挖掘的概念与方法

    1.2.1数据挖掘的分析方法

    1.2.2数据仓库与数据挖掘的关系

    1.3数据仓库的技术、方法与产品

    1.3.1OLAP技术

    1.3.2数据仓库实施的关键环节和技术

    1.3.3数据仓库实施方法论

    1.3.4常用的数据仓库产品

    1.4数据仓库系统的体系结构

    1.4.1独立的数据仓库体系结构

    1.4.2基于独立数据集市的数据仓库体系结构

    1.4.3基于依赖型数据集市和操作型数据存储的数据仓库

    体系结构

    1.4.4基于逻辑型数据集市和实时数据仓库的体系结构

    1.5数据仓库的产生、发展与未来

    1.5.1数据仓库的产生

    1.5.2数据仓库的发展

    1.5.3数据仓库的未来

    1.5.4新一代数据仓库技术

    1.6小结

    1.7习题

    第2章数据仓库的数据存储与处理

    2.1数据仓库的数据结构

    2.2数据仓库的数据特征

    2.2.1状态数据与事件数据

    2.2.2当前数据与周期数据

    2.2.3元数据

    2.3数据仓库的数据ETL过程

    2.3.1ETL的目标

    2.3.2ETL过程描述

    2.3.3数据抽取

    2.3.4数据清洗

    2.3.5数据转换

    2.3.6数据加载和索引

    2.4多维数据模型

    2.4.1多维数据模型及其相关概念

    2.4.2多维数据模型的实现

    2.4.3多维建模技术

    2.4.4星型模式举例

    2.5小结

    2.6习题

    第3章数据仓库系统的设计与开发

    3.1数据仓库系统的设计与开发概述

    3.1.1建立数据仓库系统的步骤

    3.1.2数据仓库系统的生命周期

    3.1.3建立数据仓库系统的思维模式

    3.1.4数据仓库数据库的设计步骤

    3.2基于SQLServer2005的数据仓库数据库设计

    3.2.1分析组织的业务状况及数据源结构

    3.2.2组织需求调研,收集分析需求

    3.2.3采用信息包图法设计数据仓库的概念模型

    3.2.4利用星型图设计数据仓库的逻辑模型

    3.2.5数据仓库的物理模型设计

    3.3使用SQLServer2005建立多维数据模型

    3.3.1SQLServer2005示例数据仓库环境的配置与使用

    3.3.2基于SQLServer2005示例数据库的多维数据模型

    3.4小结

    3.5习题

    第4章关联规则

    4.1概述

    4.2引例

    4.3经典算法

    4.3.1Apriori算法

    4.3.2FPgrowth算法

    4.4相关研究与应用

    4.4.1分类

    4.4.2SQLServer2005中的关联规则应用

    4.5小结

    4.6习题

    第5章数据分类

    5.1引例

    5.2分类问题概述

    5.2.1分类的过程

    5.2.2分类的评价准则

    5.3决策树

    5.3.1决策树的基本概念

    5.3.2决策树算法ID3

    5.3.3ID3算法应用举例

    5.3.4决策树算法C4.5

    5.3.5SQLServer2005中的决策树应用

    5.3.6决策树剪枝

    5.4支持向量机

    5.5近邻分类方法

    5.5.1最近邻分类方法

    5.5.2k近邻分类方法

    5.5.3近邻分类方法应用举例

    5.6小结

    5.7习题

    第6章数据聚类

    6.1引例

    6.2聚类分析概述

    6.3聚类分析中相似度的计算方法

    6.3.1连续型属性的相似度计算方法

    6.3.2二值离散型属性的相似度计算方法

    6.3.3多值离散型属性的相似度计算方法

    6.3.4混合类型属性的相似度计算方法

    6.4Kmeans聚类算法

    6.4.1Kmeans聚类算法的基本概念

    6.4.2SQLserver2005中的Kmeans应用

    6.5层次聚类方法

    6.5.1层次聚类方法的基本概念

    6.5.2层次聚类方法应用举例

    6.6小结

    6.7习题

    第7章贝叶斯网络

    7.1引例

    7.2贝叶斯概率基础

    7.2.1先验概率、后验概率和条件概率

    7.2.2条件概率公式

    7.2.3全概率公式

    7.2.4贝叶斯公式

    7.3贝叶斯网络概述

    7.3.1贝叶斯网络的组成和结构

    7.3.2贝叶斯网络的优越性

    7.3.3贝叶斯网络的三个主要议题

    7.4贝叶斯网络的预测、诊断和训练算法

    7.4.1概率和条件概率数据

    7.4.2贝叶斯网络的预测算法

    7.4.3贝叶斯网络的诊断算法

    7.4.4贝叶斯网络预测和诊断的综合算法

    7.4.5贝叶斯网络的建立和训练算法

    7.5SQLServer2005中的贝叶斯网络应用

    7.6小结

    7.7习题

    第8章粗糙集

    8.1引例

    8.2分类与知识

    8.2.1等价关系和等价类

    8.2.2分类

    8.3粗糙集

    8.3.1分类的运算

    8.3.2分类的表达能力

    8.3.3上近似集和下近似集

    8.3.4正域、负域和边界

    8.3.5粗糙集应用举例

    8.3.6粗糙集的性质

    8.4辨识知识的简化

    8.4.1集合近似精度的度量

    8.4.2分类近似的度量

    8.4.3等价关系的可省略、独立和核

    8.4.4等价关系简化举例

    8.4.5知识的相对简化

    8.4.6知识的相对简化举例

    8.5决策规则简化

    8.5.1知识依赖性的度量

    8.5.2简化决策规则

    8.5.3可辨识矩阵

    8.6小结

    8.7习题

    第9章神经网络

    9.1引例

    9.2人工神经网络

    9.2.1人工神经网络概述

    9.2.2神经元模型

    9.2.3网络结构

    9.3BP算法

    9.3.1网络结构和数据示例

    9.3.2有序导数

    9.3.3计算误差信号对参数的有序导数

    9.3.4梯度下降

    9.3.5BP算法描述

    9.4SQLServer2005中的神经网络应用

    9.5小结

    9.6习题

    第10章遗传算法

    10.1概述

    10.2相关概念

    10.3基本步骤

    10.3.1概述

    10.3.2引例

    10.4算法设计

    10.4.1编码方式

    10.4.2种群规模

    10.4.3适应度函数

    10.4.4遗传算子

    10.4.5终止条件

    10.5相关研究与应用

    10.6小结

    10.7习题

    第11章统计分析

    11.1线性回归模型

    11.1.1线性回归模型的参数估计

    11.1.2线性回归方程的判定系数

    11.1.3线性回归方程的检验

    11.1.4统计软件中的线性回归分析

    11.1.5SQLServer2005中的线性回归应用

    11.2Logistic回归模型

    11.2.1Logistic回归模型的参数估计

    11.2.2统计软件中Logistic回归的结果分析

    11.2.3SQLServer2005中的Logistic回归应用

    11.3时间序列模型

    11.3.1ARIMA模型

    11.3.2建立ARIMA模型的步骤

    11.3.3使用统计软件估计ARIMA模型

    11.3.4SQLServer2005中的时间序列分析

    11.4小结

    11.5习题

    第12章文本和Web挖掘

    12.1引例

    12.2文本挖掘

    12.2.1文本信息检索概述

    12.2.2基于关键字的关联分析

    12.2.3文档自动聚类

    12.2.4自动文档分类

    12.2.5自动摘要

    12.3Web挖掘

    12.3.1Web内容挖掘

    12.3.2Web结构挖掘

    12.3.3Web使用挖掘

    12.4小结

    12.5习题

    参考文献

(0)

相关推荐