8文一览:近期菌群研究方法学突破 | 热心肠日报
今天是第1914期日报。
Science:单菌水平的菌群空间转录组成像
Science[IF:47.728]
① 开发细菌转录组成像方法par-seqFISH,能在单菌水平上记录细菌在浮游和生物膜形式下的基因表达和生理参数;② 用该方法分析绿脓假单胞菌(Pa)在不同生长条件下的05个基因的转录谱;③ 揭示了Pa在浮游生长过程中的代谢及毒力相关细胞状态的动态变化;④ 还揭示了Pa生物膜中的基因空间表达模式和有不同生理活性的细菌亚群,如鞭毛和IV型菌毛基因表达互斥、绿脓菌素存在局部诱导并在细菌两极表达,氧气可用度塑造了生物膜中的细菌代谢异质性。
Spatial transcriptomics of planktonic and sessile bacterial populations at single-cell resolution
08-13, doi: 10.1126/science.abi4882
【主编评语】细菌在群落中的状态是异质性的,存在时间和空间上的动态变化。Science近期发表的一篇方法学文章,介绍了一种高通量的细菌空间转录组成像方法——par-seqFISH(并行序贯荧光原位杂交),能对同种细菌(甚至多种细菌)在浮游和生物膜形式下的基因表达和细胞参数(细菌大小等)进行大规模分析,以揭示细菌群落的状态和功能的时空动态和异质性,或能在菌群研究中发挥重要作用。(@mildbreeze)
Strainberry:使用长读长在低复杂度宏基因组中自动分离菌株
Nature Communications[IF:14.919]
① Strainberry是一种宏基因组组装新方法,其在单样本低复杂度宏基因组中执行菌株分离,并且唯一依赖于长读长数据;② 在合成群落上对Strainberry进行基准测试,并生成具有近乎完全参考覆盖率和99.9%基础准确度的菌株分辨率;③ 在真实数据集上应用了Strainberry,它改进了组装,比单个菌株基因组的传统宏基因组组装多产生20-118%的额外基因组材料;④ Strainberry还能够通过完全分离菌株基因组来提取复杂微生物组中的微生物多样性。
Strainberry: automated strain separation in low-complexity metagenomes using long reads
07-23, doi: 10.1038/s41467-021-24515-9
【主编评语】该研究,作者提出了一种使用易错配的长读长技术在低复杂度宏基因组中执行菌株分离的方法。其利用最先进的工具进行变体识别、单倍型定相和基因组组装,作者提出了一个名为 Strainberry 的自动化流程。它以比其他最先进的长读长组装工具更高的质量实现了菌株的单样本组装。Strainberry 结合了忽视菌株的组装程序,精心使用了长读长变体识别和单体型工具,然后是一个执行长读长宏基因组scaffolding的组件。作者在合成群落和真实样本上测试,结果表明其对现有长读长宏基因组样本的重新分析揭示了未表征的菌株。作者预计这项工作将成为在更复杂的环境中进一步改进菌株水平的宏基因组组装方法的起点。(@刘永鑫-中科院-宏基因组)
宏基因组数据构建的人肠道原核微生物基因组集HumGut
Microbiome[IF:14.65]
① 一个详尽的参考基因组集对宏基因组数据分析至关重要;② 目前缺少一个针对全球健康人肠道,且包含各基因组在人群中的出现频率信息的参考数据库;③ 作者利用超过5700个健康人肠道样本,在UHGG和RefSeq数据库中进行原核微生物基因组筛选,并以高频出现的基因组作为聚类中心,按照不同阈值进行聚类,分别得到HumGut_97.5和HumGut_95两个参考基因组集;④ HumGut的数据库大小不大于同类数据库,但能对肠道宏基因组中更多读长进行物种分类。
HumGut: a comprehensive human gut prokaryotic genomes collection filtered by metagenome data
07-31, doi: 10.1186/s40168-021-01114-w
【主编评语】本研究创建一个最通用的健康人类肠道原核基因组集合,用于作为菌群研究的参考数据库。包括来自人类肠道的 MAG 和普通的 RefSeq 基因组。HumGut 集合包含 > 30,000 个基因组,以 97.5% 的序列相似性水平进行聚类,并按人类肠道中流行率排序。作者展示了来自 IBD 患者的宏基因组同样很好地比对到这个基因组集,表明这个参考数据库也与用于获得 HumGut 的宏基因组参考数据库之外的研究相关。所有数据和元数据以及有用的代码都可以在 http://arken.nmbu.no/~larssn/humgut/ 上找到。(@刘永鑫-中科院-宏基因组)
STRONG:宏基因组菌株水平组装和分箱的新方法
Genome Biology[IF:13.583]
① STRONG是基于组装图上的菌株分辨率分箱工具,可从多个宏基因组样本中识别菌株;② 其执行共组装,并分箱到宏基因组组装基因组(MAG),并在变异简化之前存储共组装图;③ 能够提取每个MAG中单个单拷贝核心基因(SCG)的子图及每个样本的unitig覆盖率;④ 贝叶斯算法BayesPaths确定存在的菌株数量,在SCG上的单倍型或序列以及丰度;⑤ 使用合成群落进行验证该方法,且对于真正厌氧消化器时间序列生成的单倍型与从长纳米孔读数观察到单倍型匹配。
STRONG: metagenomics strain resolution on assembly graphs
07-26, doi: 10.1186/s13059-021-02419-7
【主编评语】本研究引入了一种新方法 STRONG(Strain Resolution ON Graphs),用于分析来自同一微生物群落的多个样本中的宏基因组序列。STRONG可以确定由所有样本的共组装分箱而成的MAG中“宏基因组菌株”的数量,以及它们跨多个单拷贝核心基因(我们称之为菌株单倍型)的序列,以及每个样本中每个菌株的覆盖率。STRONG通过使用一种新颖的变分贝叶斯算法BayesPaths直接在装配图上解析单倍型,避免了基于变分方法的局限性。(@刘永鑫-中科院-宏基因组)
Nature子刊:同时对来自人体菌群的数百种微生物进行核糖体分析
Nature Protocols[IF:13.491]
① 开发了MetaRibo-Seq,包括对现有核糖体分析方案的若干修改,专门解决涉及粪便样本存储、纯度和输入要求的挑战;② 论述了对人类粪便菌群执行核糖体分析MetaRibo-Seq 的详细方案;③ 详细描述了粪便样品中微生物的裂解和核糖核复合物的提取以及 MetaRibo-Seq 文库的制备和测序;④ 详细描述了评估 MetaRibo-Seq 文库质量的计算工作流程,包括读长的质量修正、宏基因组组装、MetaRibo-Seq 读长与组装的比对以及可视化。
Simultaneous ribosome profiling of hundreds of microbes from the human microbiome
08-11, doi: 10.1038/s41596-021-00592-4
【主编评语】核糖体分析已应用于培养的细菌分离株,但将其应用于未培养的混合群落一直具有挑战性。该研究提出了 MetaRibo-Seq,这是一种能够将核糖体分析直接应用于人类粪便菌群的方案。本研究提供了用于质量控制和读长修正的计算工作流程,从头组装具有宏基因组读长的参考宏基因组,将 MetaRibo-Seq 读长与参考比对,并评估 MetaRibo-Seq 文库的质量(https://github.com/bhattlab/bhattlab_workflows/tree/master/metariboseq)。此 MetaRibo-Seq 方案使标准分子生物学实验室的研究人员能够在大约 5 天的时间内研究粪便菌群中的翻译组。(@刘永鑫-中科院-宏基因组)
朱怀球团队:从宏病毒组中识别噬菌体片段宿主的工具HoPhage
Bioinformatics[IF:6.937]
① 该研究提出 HoPhage(噬菌体宿主)以从属水平的宏病毒组数据中识别给定的噬菌体片段的宿主;② HoPhage 分别使用深度学习算法和马尔可夫链模型方法,集成为两个模块;③ 在预测 50 个属中的宿主时,HoPhage 在 1 kb 长的人造噬菌体片段的属和门水平上实现了 47.90% 和 82.47% 平均准确度的大幅提升;④ 通过对三个真实的病毒组样本进行测试,HoPhage 在更广泛的参试宿主范围内在属级水平上产生了 81.11% 的平均准确度。
HoPhage: an ab initio tool for identifying hosts of phage fragments from metaviromes
08-12, doi: 10.1093/bioinformatics/btab585
【主编评语】借助宏基因组学技术,鉴定出大量无法培养的新型噬菌体,与自然携带直接宿主信息的传统基于培养的方法相比,宏基因组方法,尤其是宏病毒组,缺乏噬菌体与其细菌宿主之间的联系。因此,对开发用于短噬菌体片段宿主识别的计算工具的需求不断增加。北京大学朱怀球团队近期在Bioinformatics发表的研究中,考虑到真实群落宏基因组数据中的噬菌体片段长度较短,微生物群落的分类组成复杂,开发了HoPhage(噬菌体宿主),并展示了它在更广泛的候选宿主范围内识别短噬菌体片段宿主的良好性能。HoPhage 可在网址 http://cqb.pku.edu.cn/ZhuLab/HoPhage/ 中使用。(@刘永鑫-中科院-宏基因组)
上海交大:结合系统发育学的菌群数据的转化和差异丰度分析
Bioinformatics[IF:6.937]
① 将Dirichlet-tree多项式扩展到zero-inflated DTM,用于微生物计数的多变量建模;② 在此框架内并使用贝叶斯公式,引入后验均值变换将原始计数转换为总和为 1 的非零相对丰度;③ adaANCOM可通过在每个分类单元的树上自适应地构建对数比,大大降低了 ANCOM 在高维的计算复杂度;④ 展示了广泛的模拟研究、对 18 个身体部位和 2 次批次的 HMP 数据的分析,以及在肠道菌群和营养不良研究中的应用,以研究后均值转换和 adaANCOM 的性能。
Transformation and differential abundance analysis of microbiome data incorporating phylogeny
07-24, doi: 10.1093/bioinformatics/btab543
【主编评语】上海交通大学王涛、耶鲁大学赵宏宇与团队,近期在Bioinformatics发表研究,提出了一种基于模型的菌群数据转换方法,以及一种基于转换数据的差异丰度 (DA) 检验的系统发育信息程序。与菌群组成分析 (ANCOM) 和其他DA检验程序的比较表明,菌群组成的适应性分析(adaANCOM)可以很好地控制错误发现率,更容易地解释结果,并且对于高维问题具有计算效率。开发的R包可以在https://github.com/ZRChao/adaANCOM上找到,模拟和数据分析脚本可以在https://github.com/ZRChao/Papers_supplementary上获得。(@刘永鑫-中科院-宏基因组)
黄璐琦院士+刘永鑫:可重复和可编辑的Venn图和Venn网络在线工具EVenn
Journal of Genetics and Genomics[IF:4.275]
① 该研究开发出的EVenn可以通过一次性输入数据,3分钟内完成上述5种Venn图和Venn网络的绘制,特别适合整合数据集的探索分析和比较可视化;② 同时EVenn还提供了3种统计分析方法用于评估2个集合的相似性,并可以计算任意组数据的交并关系,对于关键基因或菌群的筛选更加便捷有效;③ 发表前4个月,Evenn共有1万多独立IP访问,同时该网站配有详细的演示数据、图文操作教程和视频教程,为科研工作者提供了有力的数据统计支持。
EVenn: Easy to create repeatable and editable Venn diagrams and Venn networks online
07-24, doi: 10.1016/j.jgg.2021.07.007
【主编评语】2021年8月2日,JGG在线发表了中国中医科学院黄璐琦院士团队和中国科学院遗传与发育生物学研究所刘永鑫高级工程师合作题为“EVenn: Easy to create repeatable and editable Venn diagrams and Venn networks online”的研究论文。该论文介绍了一款用于数据交互性探索和可视化的一站式Venn图和Venn网络在线绘制平台。EVenn的访问网址:http://www.ehbio.com/test/venn/。(@刘永鑫-中科院-宏基因组)
用于预测药物对肠道细菌影响的机器学习模型
Pharmaceutics[IF:6.321]
① 开发了机器学习(ML)模型来预测药物是否会损害40个肠道细菌菌株的生长;② 用18,680个药物-细菌相互作用进行训练,建立并比较了基于决策树、集成学习和人工神经网络技术等的13种不同的ML模型;③ 最终一种基于extra tree的算法胜出,其AUROC为0.857(±0.014),召回率为0.587(±0.063),准确率为0.800(±0.053),f1值为0.666(±0.042);④ 该模型应可用于药物研发,甚至可用于临床。
Machine Learning Uncovers Adverse Drug Effects on Intestinal Bacteria
07-06, doi: 10.3390/pharmaceutics13071026
【主编评语】药物可以对肠道菌群产生深远的影响,可能改变其功能并促进疾病的发生。Pharmaceutics近期发表研究 ,介绍了一种可用于预测药物对40个肠道细菌菌株影响的机器学习模型。(@mildbreeze)
感谢本期日报的创作者:Johnson,白蓝木,GeDeep,刘永鑫-中科院-宏基因组,mildbreeze