R语言聚类分析最佳实践:书籍
R语言聚类分析最佳实践
Practical Guide to Cluster Analysis in R
简介
尽管有几本关于无监督机器学习的好书,但我们认为其中许多书太过理论化。本书为聚类分析,优雅的可视化和解释提供了实用指南。它包含5个部分。第一部分快速介绍了R,并介绍了所需的R包以及用于集群分析和可视化的数据格式和相异性度量。第二部分介绍了分区聚类方法,该方法将数据集细分为k个组,其中k是分析人员预先指定的组数。分区聚类方法包括:K-均值,K-Medoids(PAM)和CLARA算法。在第三部分中,我们考虑分层聚类方法,这是分区聚类的另一种方法。分层聚类的结果是对象的树状表示,称为树状图。在这一部分中,我们描述如何计算,可视化,解释和比较树状图。第四部分介绍了聚类验证和评估策略,其中包括评估聚类结果的优劣。此处涵盖的各章包括:评估聚类趋势,确定最佳聚类数量,聚类验证统计信息,选择最佳聚类算法和计算p值以进行分层聚类。第五部分介绍高级聚类方法,包括:分层k均值聚类,模糊聚类,基于模型的聚类和基于密度的聚类。
本书架构
获取
赞 (0)