R语言聚类分析最佳实践:书籍

R语言聚类分析最佳实践

Practical Guide to Cluster Analysis in R

简介

尽管有几本关于无监督机器学习的好书,但我们认为其中许多书太过理论化。本书为聚类分析,优雅的可视化和解释提供了实用指南。它包含5个部分。第一部分快速介绍了R,并介绍了所需的R包以及用于集群分析和可视化的数据格式和相异性度量。第二部分介绍了分区聚类方法,该方法将数据集细分为k个组,其中k是分析人员预先指定的组数。分区聚类方法包括:K-均值,K-Medoids(PAM)和CLARA算法。在第三部分中,我们考虑分层聚类方法,这是分区聚类的另一种方法。分层聚类的结果是对象的树状表示,称为树状图。在这一部分中,我们描述如何计算,可视化,解释和比较树状图。第四部分介绍了聚类验证和评估策略,其中包括评估聚类结果的优劣。此处涵盖的各章包括:评估聚类趋势,确定最佳聚类数量,聚类验证统计信息,选择最佳聚类算法和计算p值以进行分层聚类。第五部分介绍高级聚类方法,包括:分层k均值聚类,模糊聚类,基于模型的聚类和基于密度的聚类。

本书架构

获取

(0)

相关推荐

  • 【AET原创】态势感知在网络信息安全领域的作用

    态势感知作起源于军用领域, 20世纪80年代,美国空军提出态势感知的概念.为提升空战能力,分析空战环境信息.快速判断当前及未来形势,以作出正确反应而进行的研究探索,分为感知.理解.和预测三个层次. ( ...

  • 探究智库定量分析方法及其应用

    来源:中国学派2021-05-07 11:28 作者:朱学芳(南京大学信息管理学院教授) 众所周知,智库是以战略问题和公共政策为主要研究对象,为决策者提供理论依据.思想观点.政策建议的非营利性研究咨询 ...

  • 批次效应到底是个什么东东?

    基本概念 关于批次效应的基本解释, 在10年的一篇综述当中是这么解释的. Batch effects are sub-groups of measurements that have qualitat ...

  • 【AI白身境】深度学习中的数据可视化

    今天是新专栏<AI白身境>的第八篇,所谓白身,就是什么都不会,还没有进入角色. 上一节我们已经讲述了如何用爬虫爬取数据,那爬取完数据之后就应该是进行处理了,一个很常用的手段是数据可视化. ...

  • 使用R语言做机器学习的书籍推荐

    总是有一些小伙伴觉得机器学习很高大上,令人望而生畏,其实它就是我们常见的统计学方法,比如做表达量矩阵分析,通常是需要绘制pca图看看组间差异是否足够明显. 如果你有单细胞转录组数据处理经验,实际上流程 ...

  • r语言聚类分析:k-means和层次聚类

    原文链接:http://tecdat.cn/?p=2981 聚类分析算法很多,比较经典的有k-means和层次聚类法. k-means聚类分析算法 k-means的k就是最终聚集的簇数,这个要你事先自 ...

  • 技术贴 | R语言pheatmap聚类分析和热图

    本文由阿童木根据实践经验而整理,希望对大家有帮助. 原创微文,欢迎转发转载. 导读 pheatmap默认会对输入矩阵数据的行和列同时进行聚类,但是也可以通过布尔型参数cluster_rows和clus ...

  • 技术贴 | R语言UPGMA聚类分析和树状图

    本文由阿童木根据实践经验而整理,希望对大家有帮助. 原创微文,欢迎转发转载. 导读 非加权组平均法(unweighted pair-group method with arithmetic means ...

  • R语言有限混合模型(FMM,finite mixture model)EM算法聚类分析间歇泉喷发时间

    原文链接:http://tecdat.cn/?p=22609 摘要 本文提供了一套用于分析各种有限混合模型的方法.既包括传统的方法,如单变量和多变量正态混合的EM算法,也包括反映有限混合模型的一些最新 ...

  • 数据挖掘:基于R语言的实战 | 第5章:聚类分析

    第5章我们继续来学习一种无监督的数据挖掘方法--聚类分析.通过聚类分析我们可以观察到数据是怎么聚集在一起的,还可以用来描述数据的分布情况.聚类分析的应用十分广泛,例如通过对客户聚类来对其进行细分以便为 ...

  • R语言谱聚类、K-MEANS聚类分析非线性环状数据比较

    原文链接:http://tecdat.cn/?p=23276 有些问题是线性的,但有些问题是非线性的.我假设,你过去的知识是从讨论和解决线性问题开始的,这是一个自然的起点.对于非线性问题的解决,往往涉 ...

  • 魏永明:C 语言最佳实践之头文件 | 直播预告

    喜大普奔!开源软件杰出贡献人物 -- 魏永明的在线直播又双叒叕来了! 9月11日是魏永明的首次在线直播,没想到反响热烈,受到了大家的欢迎,这就像是注入了一针鸡血,立马士气高涨.首次直播的内容是'C 语 ...

  • R语言网络和网络流的可视化实践:通勤者流动网络

    原文链接:http://tecdat.cn/?p=17654 在现实世界中,我们的生活受到大量网络的支配.网络流可以表示很多模型,比如管道中的石油.高压线中电流,或者计算机网络中的数据.网络流也可以解 ...