宏基因组专题 | 宏基因组最佳分箱工具Metabat2

本文由阿童木根据实践经验而整理,希望对大家有帮助。

原创微文,欢迎转发转载。

导读

Metabat是近几年所有分箱工具中最受欢迎的工具(引用达460+)。2019年发表在PeerJ上的新版Metabat2更是在完成度、效率等多方面均优于Metabat和同类工具[1]。仅在2019年当年Metabat2就已经被Cell、Nature Biotechnology、Genome Biology等多篇高水平期刊引用。下面通过比较来看Metabat2有哪些非常之处。

一、Bin数量和完成度

CONCOCT计算得到的Bin数量最多,其次才是Metabat2,但是Metabat2能获得的>50%完成度,>70%完成度,>90%完成度的Bin数量均>同类软件[1],比较结果如下:

另一个比较分析得到类似的结果: 与同类单算法的分箱工具(DAS_Tool为多算法)相比,Metabat2分析CAMI hign数据集得到的Bin数量在>50%, >70%, 90%三个完成度水平均是最多[2],比较结果如下表:

二、Bin纯度和完成度

Metabat2在分箱纯度和完成度分析中均有较好的表现,如下:

三、精确度和完成度

使用CAMI数据集,比较多个组装算法得到的精确度大于90%或95%的基因组数量。A、B使用的是CAMI高复杂度数据集,C、D使用的是CAMI中复杂度数据集,E、F使用的是CAMI低复杂度数据集。Recall指Completeness(完成度)。比较结果如下图,由图可见Metabat2分析不同的数据集能得到的高精确度的基因组数量均最多。

四、效率

MetaBAT2只用了7秒就完成了CAMI Low数据集,而其他大多数工具需要11分钟或更长时间,比MetaBAT2慢90倍或更多。

结束语

MetaWRAP、DAS_Tool等集合了多个算法的工具虽然表现突出 [宏基因组分箱(Binning)技术],但是时间成本非常的高,在大样本大数据的研究中行不通。所以在单样本分箱中表现最佳的Metabat2是很不错的选择 [3]。

参考

[1] MetaBAT 2: an adaptive binning algorithm for robust and efficient genome reconstruction from metagenome assemblies. PeerJ. 2019

[2] AMBER: Assessment of Metagenome BinnERs. Gigascience. 2018

[3] Extensive Unexplored Human Microbiome Diversity Revealed by Over 150,000 Genomes from Metagenomes Spanning Age, Geography, and Lifestyle. Cell. 2019

感谢您的阅读~




你可能还喜欢

1 初学者如何深入解读16S rDNA扩增子测序数据,从而选择自己的分析步骤

技术贴 | 16S专题 |基于QIIME2 dada2插件的16S扩增子测序数据的分析流程详解(上)

技术贴 | 16S专题 | 基于QIIME2 dada2插件的16S扩增子测序数据的分析流程详解(中)

技术贴 | 16S专题 | 简单介绍如何用自己的笔记本处理高通量16S数据

16S测序全新分析流程QIIME2的介绍

6 技术贴 | 微生太宏基因组报告解读(开篇)

技术贴 | 宏转录组专题 | DDBJ数据库:宏转录组测序数据下载


微生态科研学术群期待与您交流更多微生态科研问题

(联系微生态老师即可入群)。

(0)

相关推荐