FEMS:微生物群落生态学数据挖掘的R包microeco

英文原名microeco: An R package for data mining in microbial community ecology

中文译名:微生物群落生态学数据挖掘的R包microeco

作者:Chi Liu, Yaoming Cui, Xiangzhen Li, Minjie Yao

期刊:FEMS Microbiology Ecology

发表时间:2021.02

通讯作者:姚敏杰 yaomj@fafu.edu.cn

第一单位:福建农林大学资源与环境学院

原文链接:https://doi.org/10.1093/femsec/fiaa255

微生物生态学的快速发展产生了大量的群落数据,特别是随着高通量测序技术的发展,大量基于扩增子测序的微生物群落数据使得快速并灵活的进行统计分析和信息挖掘成了一个难题。通常,基于高通量测序的群落数据分析分为前期的生物信息学分析和后续的统计分析。前期的生信分析由于计算量大,通常依赖于安装有特定软件或系统的服务器。后续的分析则更注重于统计方法的使用和结果展示的快速性和灵活性。目前来看,依然缺少全面、简洁、快速的后续分析软件包。R语言包microeco 基于R6 class开发,整合了多种微生物群落生态学中常用的分析方法,归类成每个模块,以方便学习和使用,并研发了多种分析方法,同时提供了详细的教程,软件包已上传至CRAN,建议安装Github的更新版本。安装方法和使用教程等详见Github链接:https://github.com/ChiLiubio/microeco

R microeco包具有如下几个特点:

1. 使用方便,具有全面的文档说明和教程;

2. 高度模块化,容易理解、记忆、查询和使用;

3. 灵活性,提供多种算法和接口,同时中间文件也容易修改;

4. 速度快,一些算法进行了优化;

5. 涵盖广,移植了一些使用难度较大的方法,比如LEfSe、RDA、网络分析、零模型和谱系分析、物种功能分析等。

当前的microeco版本总共有10个模块。包括数据预处理模块microtable、丰度展示模块 trans_abund、维恩图分析模块 trans_venn、alpha多样性模块 trans_alpha、beta多样性模块 trans_beta、差异分析模块 trans_diff、环境因子模块 trans_env、零模型和谱系分析模块 trans_nullmodel、网络分析模块 trans_network 以及功能分析模块 trans_func。各个模块根据经验封装了一系列重要的函数来快速方便有针对性的进行分析。虽然各个模块的代码设计是单独的,但在实际使用时一些模块里的函数可以方便的进行不同模块间的联系,从而使得模块更加简洁清晰,功能明确,同时不缺乏灵活性。包的详细使用方法和示例请参考教程https://chiliubio.github.io/microeco/ 以及包中的help文档。如果由于网络问题打不开教程网址,可以进入github 下载包的ZIP压缩包,解压后打开index.html即可。

使用microeco包最基本的操作是构建microtable object,其它所有类的操作均依赖于此对象,构建此对象与phyloseq包有些相似,但更为简洁,修改也较容易,详见教程。1. 构建microtable对象最基础的方法是使用物种-样本丰度表、物种信息表和样本信息表等来构建;2. 如果前期分析使用的是QIIME2,则可以使用函数直接进行转换,生成microtable对象,参考github README中Read QIIME2 files 部分。

Microeco包目前涵盖了多种常用的分析方法类别,目的是为了快速发掘数据中的有用信息,同时兼顾到易使用性和简洁性。但是有些方法还没有进行移植,例如phyloseq包中的进化树可视化方法。因此microeco包提供了microtable对象与phyloseq对象相互转换的方法,可以使用phyloseq包进行制作,通过使用microeco包中内置函数可以直接转换microtable对象到phyloseq对象,参考'Conversion between microtable and phyloseq’部分。目前的microeco版本仍在升级中,后续会增加更多常用分析方法和模块。microeco包的作图方法大多数基于ggplot2,作图数据的下载和作图对象的调整也相对容易。后续方法的升级和调整会根据相关领域的研究进展及时进行更新,也欢迎广大使用者提供建议和帮助,共同使microeco包成为微生物生态学领域的强大工具。有相关问题可联系liuchi0426@126.com 或者yaomj@fafu.edu.cn,或在github里的Issues中留言,或加入qq群277434916 进行交流。

(0)

相关推荐

  • 我做微生物组分析--经常用到了哪些R包

    我做扩增子分析流程中常用的R包 下面介绍我常用的R包,还有一些R包比较底层,都会调用,但是不会被我们熟悉,也有一些R包我遗漏了,欢迎大家留言补充. 文件夹和文件管理 fs : 快速复制剪切文件,文件移 ...

  • 科研 | 微生物学研究,用多组学就够了吗?

    需要本文原文可以联系江舜尧,文末有联系方式. 原文题目:Are multi-omics enough? 期刊:Nature Microbiology IF:N/A 发表时间:2016年7月26日 通讯 ...

  • R包animalcules-一键式交互探索微生物组数据

    写在前面 这个包最优雅的地方在于交互式,所以学习的主要目的也就是交互式的实践.交互 图可以很好的探索数据,但一般不支持输出矢量图,不方便下游编辑和修改和用于发表.如果你找到了导出矢量图方法,请留言. ...

  • 学习微生物组数据比较成熟的R包microbiome

    learning_microbiome_2 这两个包的安装比较麻烦 无法下载得到github包,或者无法安装后,将github包手动下载下来,解压之后定位文件夹名称后安装 这部分用来学习微生物组成的操 ...

  • 微生物生态-代谢组分析最难安装的四个R包(Ubuntu)

    前两天老板升级了组内的服务器,我换了硬盘,由于之前是ubuntu16.04 server版本的系统,R环境也是3.4,,相关R包等等版本比较旧.所以我决定重新安装一次系统并重新配置了rstudio-s ...

  • Microbiome:animalcules-交互式微生物组分析和可视化的R包

    animalcules-交互式微生物组分析和可视化的R包 animalcules: interactive microbiome analytics and visualization in R Mi ...

  • R Documentation:整合的R包说明平台

    R包是我们生息分析中不可缺少的工具,在学习和使用过程中,我们常会遇到:无法找到解决实际需要的函数,或希望有汇总的网站可以找到相关包的具体说明.搜索R包的途径有很多,例如分别通过RCRAN mirror ...

  • 5个画热图的R包,你都知道吗?

    2017-03-21 17:45 之前我们分享过R语言绘制热图(),用的是pheatmap包.其实画热图还可以用heatmap函数.ggplot2包.gplot包.lattice包来画,惊呆了吧~~ ...

  • 如何获取R自带数据集与R包数据集说明文档?

    学习R的时候,我们都会用到R到自带数据集,或者第三方R包内含的数据集,比如iris鸢尾花数据. 有数据集,比如上面这个iris数据,但是我们不了解该数据集具体背景的话,就难以理解它的分析目的,统计分析 ...

  • R包终极解决方案

    写在前面: 在如何通过Google来使用ggplot2可视化这篇文章中,我们曾经介绍过R语言在生物信息学中的重要性. 这篇文章也激发了很多小伙伴学习的热情.学习R语言必然会安装各种各样的包,很多人在这 ...