ComplexHeatmap绘制热图详细步骤

pheatmap是一个非常受欢迎的绘制热图的R包。ComplexHeatmap包即是受之启发而来。你可以发现Heatmap()函数中很多参数都与pheatmap()相同。在pheatmap的时代(请允许我这么说),pheatmap意思是pretty heatmap,但是随着时间推进,技术发展,各种新的数据出现,pretty is no more pretty,我们需要更加复杂和更有效率的热图可视化方法对庞大的数据进行快速并且有效的解读,因此我开发并且一直维护和改进着ComplexHeatmap包。

为了使庞大并且“陈旧”的(对不起,我不应该这么说)pheatmap用户群能够迅速并且无痛的迁移至ComplexHeatmap,从2.5.2版本开始,我在ComplexHeatmap包中加入了一个pheatmap()函数,它涵盖了pheatmap::pheatmap()所有的功能,也就是说,它提供了和pheatmap::pheatmap()一模一样的参数,并且生成的热图的样式也几乎相同。同时,ComplexHeatmap::pheatmap()函数也能使用ComplexHeatmap独有的功能,比如对行和列进行切分,加入自定义的annotation,多个热图和annotation的连接,或者创建一个互动的热图(interactive heatmap, 通过ht_shiny()函数)

ComplexHeatmap::pheatmap()包含了pheatmap::pheatmap()中所有的参数,这意味着,当你从pheatmap迁移至ComplexHeatmap时,你无需添加任何额外的步骤,你只需要载入ComplexHeatmap而不是pheatmap包,然后重新运行你原始的pheatmap代码。剩下的你只是去见证奇迹的发生。

注意如下五个pheatmap::pheatmap()的参数在ComplexHeatmap::pheatmap()中被忽视:

  • kmeans_k:在pheatmap::pheatmap()中,如果这个参数被设定,输入矩阵会进行k均值聚类,然后每个cluster使用其均值向量表示。最终的热图是k个均值向量的热图。此操作改变了原始矩阵的大小,而且每个cluster的大小信息丢失了,直接解读均值向量可能会造成对数据的误解。我不赞成此操作,因此我没有支持这个参数。在ComplexHeatmap中,row_kmcolumn_km参数可能是一个更好的选择。
  • filename:如果这个参数被设定,热图直接保存至指定的文件中。我认为这只是画蛇添足(没有贬低pheatmap的意思,只是最近在给小孩讲成语故事,然后想在这里使用一下)的一步,ComplexHeatmap::pheatmap()不支持此参数。
  • width:filename的宽度。
  • height:filename的长度。
  • silent: 是否打印信息。

pheatmap::pheatmap()中,color参数需要设置为一个长长的颜色向量(如果你想用100种颜色的话),比如:

pheatmap::pheatmap(mat,     color = colorRampPalette(rev(brewer.pal(n = 7, name = "RdYlBu")))(100))

ComplexHeatmap::pheatmap()中,你可以简化无需使用colorRampPalette()去扩展更多的颜色,你可以直接简化为如下,颜色会被自动插值和扩展。

ComplexHeatmap::pheatmap(mat,     color = rev(brewer.pal(n = 7, name = "RdYlBu")))

例子

我们首先创建一个随机数据,这个来自于pheatmap包中提供的例子(https://rdrr.io/cran/pheatmap/man/pheatmap.html).

test = matrix(rnorm(200), 20, 10)test[1:10, seq(1, 10, 2)] = test[1:10, seq(1, 10, 2)] + 3test[11:20, seq(2, 10, 2)] = test[11:20, seq(2, 10, 2)] + 2test[15:20, seq(2, 10, 2)] = test[15:20, seq(2, 10, 2)] + 4colnames(test) = paste("Test", 1:10, sep = "")rownames(test) = paste("Gene", 1:20, sep = "")

我们载入ComplexHeatmap包,然后执行pheatmap()函数,生成一副和pheatmap::pheatmap()非常类似的热图。

library(ComplexHeatmap)# 注意这是ComplexHeatmap::pheatmappheatmap(test)

ComplexHeatmap::pheatmap()中,按照pheatmap::pheatmap()的样式进行了相应的配置,因此,大部分元素的样式一模一样。只有少部分不一致,比如说热图的legend。

下一个例子是在热图中加入annotation。以下代码是在pheatmap()中添加annotation。如果你是pheatmap()用户,你应该对annotation的数据格式不太陌生。

annotation_col = data.frame(    CellType = factor(rep(c("CT1", "CT2"), 5)),     Time = 1:5)rownames(annotation_col) = paste("Test", 1:10, sep = "")

annotation_row = data.frame(    GeneClass = factor(rep(c("Path1", "Path2", "Path3"), c(10, 4, 6))))rownames(annotation_row) = paste("Gene", 1:20, sep = "")

ann_colors = list(    Time = c("white", "firebrick"),    CellType = c(CT1 = "#1B9E77", CT2 = "#D95F02"),    GeneClass = c(Path1 = "#7570B3", Path2 = "#E7298A", Path3 = "#66A61E"))

pheatmap(test,     annotation_col = annotation_col,     annotation_row = annotation_row,     annotation_colors = ann_colors)

看起来和pheatmap::pheatmap()还是很一致。

ComplexHeatmap::pheatmap()内部其实使用了Heatmap()函数,因此更多的参数都最终传递给了Heatmap()。我们可以在pheatmap()中使用一些Heatmap()特有的参数,比如row_splitcolumn_split来对行和列进行切分。

pheatmap(test,     annotation_col = annotation_col,     annotation_row = annotation_row,     annotation_colors = ann_colors,     row_split = annotation_row$GeneClass,    column_split = annotation_col$CellType)

ComplexHeatmap::pheatmap()返回一个Heatmap对象,因此它可以与其他Heatmap/HeatmapAnnotation对象连接。换句话说,你可以使用炫酷的+或者%v%对多个pheatmap水平连接或者垂直连接。

p1 = pheatmap(test, name = "mat1")p2 = rowAnnotation(foo = anno_barplot(1:nrow(test)))p3 = pheatmap(test, name = "mat2",     col = c("navy", "white", "firebrick3"))p1 + p2 + p3

ComplexHeatmap支持将一个热图导出为一个shiny app,这也同样适用于pheatmap(),因此你可以这样做:

ht = pheatmap(...)ht_shiny(ht) # 强烈建议试一试

还有一件重要的小事是,因为ComplexHeatmap::pheatmap()返回一个Heatmap对象,如果pheatmap()并没有在一个interactive的环境执行,比如说在一个R脚本中,或者在一个函数/for loop中,你应该显式的调用draw()函数进行画图。

for(...) {    p = pheatmap(...)    draw(p)}

最后我想说的事,这篇文章的主旨并不是鼓励用户直接使用ComplexHeatmap::pheatmap(),我只是在此展示了pheatmap完全可以用ComplexHeatmap来代替,而且ComplexHeatmap提供了工具让用户无需任何额外的操作(zero effort)就可以迁移以前旧的代码。但是我还是强烈建议用户直接使用ComplexHeatmap中的“正经函数”。

从pheatmap到ComplexHeatmap的翻译

在“阅读原文”中,你可以找到一个表格,其中详细的列出了如何将pheatmap::pheatmap()中的参数对应到Heatmap()中。

比较

这一小节我比较了相同参数下pheatmap::pheatmap()生成的热图和ComplexHeatmap::pheatmap()的相似度。我使用了pheatmap包中所有的例子(https://rdrr.io/cran/pheatmap/man/pheatmap.html)。同时我也使用了ComplexHeatmap中提供的一个简单的帮助函数ComplexHeatmap::compare_pheatmap()。它的功能就是把参数同时传递给pheatmap::pheatmap()ComplexHeatmap::pheatmap(),然后生成两幅热图,这样可以直接进行比较。因此如下代码

compare_pheatmap(test)

其实等同于:

pheatmap::pheatmap(test)ComplexHeatmap::pheatmap(test)

在往下阅读之前,我先告诉你结论:pheatmap::pheatmap()ComplexHeatmap::pheatmap()产生的热图几乎完全相同。

只提供一个矩阵:

compare_pheatmap(test)

对列进行z-score归一化,行聚类距离使用相关性距离:

compare_pheatmap(test,     scale = "row",     clustering_distance_rows = "correlation")

设定颜色:

compare_pheatmap(test,     color = colorRampPalette(c("navy", "white", "firebrick3"))(50))

不对行聚类:

compare_pheatmap(test,     cluster_row = FALSE)

不显示legend:

compare_pheatmap(test,     legend = FALSE)

在矩阵格子上显示数值:

compare_pheatmap(test,     display_numbers = TRUE)

对矩阵格子上的数值进行格式化:

compare_pheatmap(test,     display_numbers = TRUE,     number_format = "%.1e")

自定义矩阵格子上的文字:

compare_pheatmap(test,     display_numbers = matrix(ifelse(test > 5, "*", ""),                              nrow(test)))

定义legend上的label:

compare_pheatmap(test,     cluster_row = FALSE,     legend_breaks = -1:4,     legend_labels = c("0", "1e-4", "1e-3", "1e-2", "1e-1", "1"))

热图的标题:

compare_pheatmap(test,     cellwidth = 15,     cellheight = 12,     main = "Example heatmap")

添加列的annotation:

annotation_col = data.frame(    CellType = factor(rep(c("CT1", "CT2"), 5)),     Time = 1:5)rownames(annotation_col) = paste("Test", 1:10, sep = "")

annotation_row = data.frame(    GeneClass = factor(rep(c("Path1", "Path2", "Path3"), c(10, 4, 6))))rownames(annotation_row) = paste("Gene", 1:20, sep = "")

compare_pheatmap(test,     annotation_col = annotation_col)

不绘制annotation的legend:

compare_pheatmap(test,     annotation_col = annotation_col,     annotation_legend = FALSE)

同时添加行和列的annotation:

compare_pheatmap(test,     annotation_col = annotation_col,     annotation_row = annotation_row)

调整列名的旋转:

compare_pheatmap(test,     annotation_col = annotation_col,     annotation_row = annotation_row,     angle_col = "45")

调整列名的旋转至水平方向:

compare_pheatmap(test,     annotation_col = annotation_col,     angle_col = "0")

控制annotation的颜色:

ann_colors = list(    Time = c("white", "firebrick"),    CellType = c(CT1 = "#1B9E77", CT2 = "#D95F02"),    GeneClass = c(Path1 = "#7570B3", Path2 = "#E7298A", Path3 = "#66A61E"))

compare_pheatmap(test,     annotation_col = annotation_col,     annotation_colors = ann_colors,     main = "Title")

同时控制行和列annotation的颜色:

compare_pheatmap(test,     annotation_col = annotation_col,    annotation_row = annotation_row,     annotation_colors = ann_colors)

只提供部分annotation的颜色,未提供颜色的annotation使用随机颜色:

compare_pheatmap(test,     annotation_col = annotation_col,     annotation_colors = ann_colors[2]) 

将热图分为两部分,我建议直接使用Heatmap()中的row_split或者row_km参数。

compare_pheatmap(test,     annotation_col = annotation_col,     cluster_rows = FALSE,     gaps_row = c(10, 14))

使用cutree()对列的dendrogram切分:

compare_pheatmap(test,     annotation_col = annotation_col,     cluster_rows = FALSE,     gaps_row = c(10, 14),     cutree_col = 2)

自定义行名:

labels_row = c("", "", "", "", "", "",     "", "", "", "", "", "", "", "", "",     "", "", "Il10", "Il15", "Il1b")compare_pheatmap(test,     annotation_col = annotation_col,     labels_row = labels_row)

自定义聚类的距离:

drows = dist(test, method = "minkowski")dcols = dist(t(test), method = "minkowski")compare_pheatmap(test,     clustering_distance_rows = drows,     clustering_distance_cols = dcols)

对聚类的回调处理:

library(dendsort)callback = function(hc, ...){dendsort(hc)}compare_pheatmap(test,     clustering_callback = callback)
(0)

相关推荐

  • 技术贴 | R语言pheatmap聚类分析和热图

    本文由阿童木根据实践经验而整理,希望对大家有帮助. 原创微文,欢迎转发转载. 导读 pheatmap默认会对输入矩阵数据的行和列同时进行聚类,但是也可以通过布尔型参数cluster_rows和clus ...

  • R语言学习系列之“多变的热图”

    咱公众号也不能只做一个系列,所以经过深思熟虑,打算将来慢慢增加一些内容,主要有以下几个系列TCGA数据分析系列GEO数据分析系列"老板给一个基因,我该怎么办"系列文献阅读系列R语言 ...

  • 拟时序分析的热图提取基因问题

    昨天我在单细胞天地讲解了使用monocle2进行拟时序分析的方法,基本上跟着我的代码走一波就可以学会了,当然具体参数理解需要自行发力哦,见:使用monocle做拟时序分析(单细胞谱系发育) 用法只是最 ...

  • NC单细胞文章复现(三):复杂热图

    我们这次直接拿GSE118390上已经normalized 的数据进行下游分析.首先我们先看看文献的这张复杂热图,哈哈,这张热图画得真是好看.左边是不同的markers基因对应的细胞类型,上边是6个T ...

  • R绘图笔记 | 热图绘制

    关于绘图,前面介绍了一些: R绘图笔记 | 一般的散点图绘制 R绘图笔记 | 柱状图绘制 R绘图笔记 | 直方图和核密度估计图的绘制 R绘图笔记 | 二维散点图与统计直方图组合 R绘图笔记 | 散点分 ...

  • 技术贴 | R语言:构建一个转录代谢互作调控网络:(二)热图的美化以及大样本分组信息的快速注释

    本文由可爱的乔巴根据实践经验而整理,希望对大家有帮助. 原创微文,欢迎转发转载. 导读 上期介绍了利用WGCNA包中的Cor函数和corPvalueStudent函数计算两组小样本的相关性并进行热图可 ...

  • 快来使用ggheatmap强化你的热图吧!

    创作原因 用法 参数 可视化 综合示例 结语 创作原因 目前最为常见的热图绘制R包,主要包括pheatmap和ComplexHeatmap(仅个人使用习惯).它们强大的功能,基本可以满足所有科研人员的 ...

  • 使用NMF代替层次聚类

    前面我们在教程:使用R包deconstructSigs根据已知的signature进行比例推断,顺利的把508个病人,根据11个signature进行了比例推断,得到的比例矩阵以普通的热图,以及phe ...

  • 线条的魅力,线描插画过程图详细步骤讲解,教你如何零基础画画

    线条的魅力,线描插画过程图详细步骤讲解,教你如何零基础画画 喜欢画画的小伙伴一起来分享自己的绘画心得呀~ (此图为procreate手绘,在纸上用中性笔或者针管笔画的步骤是一样的,如果后期准备上色一定 ...

  • 用Calypso在线绘制热图、树状图及Krona图

    用Calypso在线绘制热图、树状图及Krona图

  • 为什么我代码里面选择top1000的sd基因绘制热图呢

    实际上写完了这个全网最好的差异分析代码:免费的数据分析付费的成品代码 我就可以收工用来,但是永远不能低估粉丝的疑惑数量,任何一个细节都会被拿出来剖析. 比如代码里面我挑选了top1000的sd基因绘制 ...

  • 自己写代码计算单细胞转录组数据的CNV及绘制热图

    前面我们提到过broad开发了工具来对单细胞转录组数据计算CNV及绘制热图,因为这个方法学本来就是他们建立起来的. 单细胞转录组数据分析CNV 使用broad出品的inferCNV来对单细胞转录组数据 ...

  • 使用Excel绘制热图 - 太简单!

    使用Excel绘制热图 事实上,对于大多数生物背景的朋友或者日常工作为湿实验的朋友,最实用,最简单的绘制一张热图或者直观地展示基因表达趋势的方式是使用Excel直接绘制一张热图. 虽然现在已经有很多网 ...

  • ComplexHeatmap|绘制单个热图-I

    ComplexHeatmap可以绘制很复杂的热图,能满足日常以及文章所需,本次先简单的介绍单个热图绘制的内容. 单个热图由热图主体和热图组件组成.其中主体可分为行和列:组件可以是标题.树状图.矩阵名称 ...

  • 详细步骤图讲解插画的绘制,水彩花卉和猫咪,清新有趣!

    详细步骤图讲解插画的绘制,水彩花卉和猫咪,清新有趣! 绘画工具: 水彩纸.铅笔.橡皮.固体水彩颜料.黑天鹅水彩毛笔.勾线毛笔.高光笔 过程图讲解: 001.在画画之前先找好素材哦~在正式画之前一定要有 ...

  • 钩针编织漂亮的向日葵花小开衫,有详细步骤图

    这是一件拼花的衣服,钩好一片花断线,再钩另一片花同时连接前一片花. 先从第一片单元花说起吧 1,钩16个小辫子 2:在倒数第9个辫子上钩一个长针,再2辫子,隔三个辫子1长针,再4辫子和起头锁住. 3: ...

  • 素描人头像初学步骤图,人像素描的基本画法(详细步骤)

    现在有很多人都在学习画素描人像画,不过对于初学者而言想要画一幅很出彩的素描人像还是比较难的,特别是素描五官的详细画法,很多画友都在问爱画君怎么画的,今天为大家带来素描人头像初学步骤图,一步一步教你人像 ...