技术贴 | 微生太宏基因组报告解读 | 第八篇:功能分析-基于MetaCyc数据库
本文由阿童木根据实践经验而整理,希望对大家有帮助。
原创微文,欢迎转发转载。
MetaCyc数据库是一个通过实验手段阐释代谢通路的数据库。MetaCyc目标是收集所有已知生命的代谢通路。MetaCyc是一个庞大而全面的数据库,目前包含了来自3009个不同生物的2722个代谢通路。MetaCyc的代谢网络包含了初生代谢,次生代谢,还包括相关的化合物、酶和基因。
一、组成概况
根据数据库的注释结果,绘制各样品Pathway相对丰度统计图。下图是相对丰度前20的Pathway相对丰度柱形图,其中不同的颜色代表不同的Pathway类别。
二、LEfSe差异分析
LEfSe是一种结合了非参数检验和线性判别分析的方法,常被用于寻找可以区分多组样品的Biomarker。LEfSe分析结果中的Pathway的LDA>阈值,表示该Pathway在相应分组中丰度较高,而在其他分组中丰度较低。下图是Pathway的LEfSe分析LDA柱形图。
三、功能物种来源分析
LEfSe分析得到的差异Pathway结合HUMAnN2的分析结果,可进行功能物种来源分析,分析特征Pathway在每个样品的物种中的分布情况。下图是Pathway物种来源组成柱形图,其中横坐标对应样本,以及样本分组,不同分组用不同颜色标出。纵坐标对应各个样本该功能的相对丰度,不同物种来源用不同颜色标出。
四、聚类分析
从Pathway的相对丰度表中筛选出丰度排名前20的Pathway,接着通过对多个样品的Pathway进行丰度聚类来考察Pathway丰度在不同样品或者分组间的相似或差异性。下图是Pathway聚类热图。
五、Circos图分析
Circos图可以用于展示每个样本中Pathway的丰度,以及各个Pathway分别在各个样本中的比例。下图是Pathway在各个样本中的分布Circos图。其中左半圈为丰度最高的十个Pathway,每个Pathway内,不同颜色代表不同样本来源的比例;右边半圈为样本,样本内不同颜色代表不同Pathway的比例。
六、 相关分析
相关分析可用于分析环境因子或其它组学数据与宏组学数据之间的相关性。先选出丰度较高的Pathway,再计算环境因子与抗性基因间的Spearman相关系数进行,最后选出与环境因子相关最多的Pathway,可以得到如下的Pathway与环境因子之间的相互关系热图。其中X轴上为环境因子,Y轴为Pathway。R值(相关系数)在图中以不同颜色展示,右侧图例是不同R值的颜色区间。* 0.01≤ P <0.05,** 0.001≤P < 0.01,*** P < 0.001。
七、 RDA分析
RDA分析可用于研究环境因子、样品、功能三者之间的关系,寻找影响样品分布的重要环境驱动因子。RDA分析更多的描述请见前面的篇章。下图是Pathway RDA分析的结果。
感谢阅读~
你可能还喜欢
1 技术贴 | 微生太宏基因组报告解读(开篇)
2 技术贴 | 微生太宏基因组报告解读 | 第一篇:测序数据过滤
3 技术贴 | 微生太宏基因组报告解读 | 第二篇:物种组成分析
4 技术贴 | 微生太宏基因组报告解读 | 第三篇:物种分组统计分析
5 技术贴 | 微生太宏基因组报告解读 | 第四篇:PCoA、NMDS、RDA/CCA、相关分析
6 技术贴 | 微生太宏基因组报告解读 | 第五篇:EggNOG、CAZy、CARD等7大数据库助力宏基因组功能分析
7 技术贴 | 微生太宏基因组报告解读 | 第六篇:功能分析-基于KEGG数据库