技术贴 | Excel:手把手教你如何做扩增子菌群数据与表观数据相关性热图
本文由技均根据实践经验而整理,希望对大家有帮助。
原创微文,欢迎转发转载。
扩增子是一种较为经济的微生物测序方法,时常被广大科研工作者所选择。在进行数据分析时,需要将菌群数据与表观数据做相关性分析,来预测某种菌属与某种表观性状的相关性。热图可以通过Graphpad8.02以上版本来制作(版本以上自带热图、小提琴图制作),但缺点在于Graphpad制作的热图需要手动标上星号(当某种菌属与某种表观性状显著相关时记为*,极显著相关时记为**),当大量的菌群数据进行分析时,手动标*十分繁琐且极易出错。当然,我们也可以通过R语言编程来实现*与热图的自动匹配。
为方便讲解,本文以8种菌属 (g_Eubacterium_fissicatena_group等,具体见Excel附件“示例”) 数据和3个表观数据(A,B,C)为例,通过Excel进行相关性热图制作,适合编程语言零基础的科研人员。
文中提及附件和示例可联系文末的微生态老师免费领取!
如果对您有帮助,请三连一波哦~
点赞,在看,转发!!!
具体步骤如下:
1、整合数据→将数据导入SPSS分析软件→相关性分析→导出相关性分析结果到Excel
由于SPSS数据分析是科研人员基本技能,这里就不详细讲解,得到以下数据结果(图1)。
图1
删除多余的重复数据,只保留相关性系数结果(图2)。复制两次该sheet(分别命名为“不带星号(已排序)”、“带星号(已排序)”)
图2
在“不带星号(已排序)”sheet下删除所有*(通过复制数据到Word,查找*,全部替换为空格,得到无星号的数据,全选复制回Excel,见Word附件1/图3,当数据很大时,必须通过Word的“查找替换”来删除*)。最右列插入sum函数,计算每一行的sum值(图4,必须先删除*,才能进行sum计算)。将sum列数值粘贴至“带星号(已排序)”(图5)
图3
图4
图5
先后在“不带星号(已排序)”、“带星号(已排序)”sheet下选中F列,扩展选定区域,降序排列(图6,图7)。
图6
图7
在“带星号(已排序)”sheet下,复制带有星号的相关性数据,到Word,查找“^#”替换为空格,去掉所有数字,再查找“.”替换为空格,去掉所有“.”,再查找“-”替换为空格,去掉所有“-”。得到只含星号的数据,见Word附件2/图8。复制星号到“不带星号(已排序)”,可通过加粗、居中等方式调整*大小和位置(图9)。
图8
图9
选中“不带星号(已排序)”sheet下的相关性数据,点击条件格式,新建规则,格式样式(三色刻度),类型(数字,数字,数字。不能选最低值和最高值),值(-1,0,1),颜色(蓝,白,红),这样就建立了从最小值-1到0到最大值1的颜色对应渐变(图10)。你会看到相关性数字下面都有颜色,这时要隐藏数字,选中所有数字,设置单元格格式,自定义,将“G/通用格式”改成 “;;”,数字就隐藏了,此时双击可见数字(图11)。
图10
图11
可以直接将Excel表格数据以矢量图的方式复制粘贴到AI,避免像素的降低(编者经验),具体的Excel表格数据转AI操作下回分解。成品图见图12。
图12
学会了以上方法,就可以通过Excel制作大数据下扩增子菌群数据与表观数据相关性热图啦。
本文来源于微生态原创作者技均,仅用于学术分享,如有侵权,请联系删除!
免费领取方法
关注《微生态》公众号,扫码联系微生态老师18(微信号M18018711790),备注《技术贴∣Excel:扩增子菌群数据与表观数据相关性热图》,即可获得相关附件。
你可能还喜欢
微生太公司视频号上线啦,快来关注一波吧!