科研 | 结合基因组及肠道菌群的培养以改善宏基因组分析(IF:35.724)
本文由木子编译,董小橙、江舜尧编辑。
原创微文,欢迎转发转载。
导 读
了解肠道微生物组功能需要培养细菌进行实验验证,引用细菌基因组序列来解释元基因组数据集并指导功能分析。我们展示了人类胃肠道细菌培养标本(HBC),这是一套包含737个全基因组测序的细菌分离物的综合样本,代表了在人类胃肠道微生物群中发现的31个科中的273种(105个新物种)。HBC使来自人类胃肠道微生物群的细菌基因组数量增加了37%。由此产生的全球人类胃肠道细菌基因组采集(HGG)在13,490个鸟枪法测序的元基因组样本中按丰度对83%的属进行分类,与人类微生物组计划(HMP)基因组相比提高了61%的分类类别,几乎50%的序列实现了亚种级分类。胃肠道细菌参考序列资源的改善,避免了对原基因组重新组装的依赖,实现了对人体胃肠道微生物群的精确和经济有效的鸟枪原基因组分析。
论文ID
原名:A human gut bacterial genome and culture collection for improved metagenomic analyses
译名:人类肠道细菌基因组及培养收集以改进宏基因组分析
期刊:Nature biotechnology
IF:35.724
发表时间:2019年2月
通信作者:Trevor D. Lawley
通信作者单位:Host-Microbiota Interactions Laboratory, Wellcome Sanger Institute, Wellcome Genome Campus, Hinxton, UK
实验设计
实验设计图
实验结果
胃肠道细菌培养标本的组装。
为了从人体胃肠道中收集完整的细菌分离物,从英国(n = 8)和北美(n = 12)的20名成年人的粪便样本中,我们培养和纯化了细菌分离物。总的来说,我们挑选了超过10,000个细菌分离株,然后使用16 S Rrna基因测序对其进行分类。结合我们之前报道的234株胃肠道分离株17,737株纯化和存档的分离株被纳入HBC。该标本代表放线菌门(53个基因组;16种)中31科273种(105个新物种);拟杆菌门(143个基因组;40种),厚壁菌门(496个基因组;203种)和变形杆菌(45个基因组;14种)(补充材料表1)。HBC中每个分离株都有一个基因组序列。
我们将我们的HBC基因组与通过美国国家生物技术信息中心(NCBI)基因组数据库获得的617个公开的、高质量的人类胃肠道相关细菌基因组相结合,生成了人类胃肠道微生物基因组集合(HGG; 补充材料表1)。值得注意的是,HGG基因组中53%的物种被保存在HBC中。目前HBC中不存在但HGG中存在的许多剩余物种包括梭菌、变形菌和互养菌的成员,这在发达国家的健康个体中通常不存在。这表明,需要从更多样化的健康供体和受疾病影响的供体中进一步定向培养,以详尽地存档人类消化道微生物群的细菌成分。
总的来说,HGG中的1354个基因组共代表放线菌门(129个基因组;55种)中57科530种;拟杆菌门(231个基因组;69种),厚壁菌门(772个基因组;339种)、梭菌(26个基因组;9种),变形杆菌(194个基因组;56种)和互养菌门(2个基因组;2种) (补充材料图1)。为了了解这些类群之间的系统发育关系,我们从每个基因组中提取了40个通用核心基因21进行系统发育分析(图1;补充材料图2)。总体而言,厚壁菌门的系统发育多样性最大,特别是Clostridia, Erysipelotrichia 和Negativicutes;然而,在所有的门中都有广泛的物种和系统发育群(图1;补充材料图2)。
图1 人胃肠道微生物群基因组系统发育的多样性。最大似然树由来自737HBC基因组(绿色外圈)的40个通用核心基因和来自人类胃肠道样本的617个高质量公共基因组共同组成。分枝颜色区分Actinobacteria (金;n = 129个基因组),Bacteroidetes (绿色;n = 231个基因组),Firmicutes (蓝色;n = 772个基因组),Fusobacteria (黑色;n = 26个基因组),Synergistetes (粉色;n = 2个基因组)和Proteobacteria (橙色;n = 194个基因组)。
HGG改善胃肠道宏基因组学分析。
在没有参考基因组的情况下,最先进的元基因组测序分析依赖于未知基因组序列进行测序的De novo assembly,然后是contig binning分析生成元基因组组装序列(MAGs)。为了比较De novo assembly和binning 的分类效率,我们考虑了13490个来自粪便的鸟枪元基因组(补充表2),这些基因组具有足够的从头组装的可读范围。De novo assembly和contig binning识别出11,892个样本(88.2%),这些样本的质量足以产生长度大于或等于2,000个碱基对(bp)的序列。从9548个组件中共获得39913个(> 90%完整性< 5%污染),以下简称MAGs(补充表3),其中81%至少有15个tRNA,进一步强调了其高完整性;然而,只有16.1% (四分位范围,IQR = 31.2%-8.2%)的阅读碱基参与了这些MAGs(图2a)。HGG能够识别25,085个MAGs,相比之下,20,772个基因组只对应于HBC。同时,从18个体位采集的HMP标本中鉴定出16476个MAGs,仅从胃肠道体位(HMP- gi)分离出的HMP标本中检测到15156个MAGs。与完整的HMP相比,使用HGG收集作为参考,这代表了52.3%的改进(图2b)。由于HGG的基因组集合比HBC、HMP和HMP- GI 的基因组集合大得多,我们接下来对每个基因组数据库进行bootstrap亚采样,并通过平均核苷酸标识(ANI > 95%)将所选基因组与之前识别的MAGs进行比较。HBC基因组收集19,036个匹配,HMP全基因组收集14,906个匹配,HMP全基因组收集9,655个匹配(图2c)。在完整的HMP中,分类受到阻碍,因为它包含了来自非胃肠道物种的基因组。值得注意的是,使用HGG和HBC基因组获得的更大的匹配表明,在这些数据集中还存在更具有代表性的系统发育多样性。因此,我们的分析显示,与现有基因组相比,HGG的分类潜力增加了61.1%。
图2 比较来自de novo assembly和HGG的高质量参考基因组。a,读取碱基用量,作为宏基因组样本(n = 13,490)中存在的总读取碱基的百分比,可以映射到它们各自的de novo assembled的重叠群(最小,22.23;Q1:62.87;中位数,76.89;Q3,89.99;最大值,99.98)和宏基因组装配的基因组(MAGs;最小,0.16;Q1,8.17;中位数,16.09;Q3,31.16;最大,65.64)。b,使用HGG(蓝色)的分类箱的总数,源自HBC集合中的基因组(HBC;橙色),HMP(紫色)和来自HMP的胃肠来源的分离物(HMP-GI;绿色)。c,使用来自HGG(蓝色)、HBC(橙色)、HMP(紫色)和HMP- gi(绿色)的基因组亚采样集对39,913个MAGs进行分类。错误栏显示平均值和s.d. (n = 100)。
宏基因组中基于系统发育来评价基因图谱覆盖度。
虽然可以使用de novo assembly 和binning 的方法来生成MAGs,但是该方法仍然无法处理本研究中分析的13,490个鸟枪元基因组测序样本中83.9%的测定序列。为了解决这个限制,接下来我们将de novo assembly 与HGG进行比较,以确定是否有能力对更大比例的输入数据进行分类。应用该方法,我们能够在大约相当于属(90%)的水平上绘制74.5% (IQR = 84.1% - 62.9%)的序列,而在物种(95%)水平上绘制67.3% (IQR = 78.7%-54.8%)的序列(图3 a)。值得注意的是,40.8%(54.3%- 30.0%)可归类于物种水平(99%),尽管不包括在HGG中从这些样品中培养的任何分离物。总的来说,这些分析表明,即使在考虑不同地理种群的样本时,使用HGG也可以对大部分来自人类胃肠道微生物群的宏基因组测序结果进行高分辨率分类(图3 b)。
图3 使用HGG的|分类效率。a,重叠群分配自13490个属的宏基因组样本与HGG相比同一性,属(90%;最小,31.35;Q1,62.92;中位数,74.48;Q3,84.10;最大,100.0),物种(95%;最小,18.94;Q1,54.80;中位数,67.35;Q3,78.73;最大,100.0)和菌株(99%;最小,0.0;Q1,30.03;中位数,40.82;Q3,54.35;最大,90.77)。b,北美宏基因组测序样本分类(n = 2064;最小,1.31;Q1,79.07;中位值,88.16;Q3,98.42;最大,99.97),欧洲(n = 1431;最小,52.07;Q1,76.28;中位数,80.66;Q3,84.47;最大,99.52。亚洲(n = 191;最小,72.37;Q1,86.56;中位数,90.84;Q3,94.13;最大,98.93)和其他未定义位置(n = 9804;最小,1.45;Q1,76.28;中位值,82.14;Q3,88.25;最大,99.94)。
人类胃肠道细菌多样性。
接下来,我们试图通过HGG来了解哪些物种在人类胃肠道微生物群中最为普遍。要做到这一点,我们研究了13940份来源于人类粪便的优质鸟枪宏基因组样本(补充表2)。虽然这种分析可能会受粪便样本储存条件和DNA提取方法的变化的影响23,我们推断,那些在许多个体样本中非常普遍的物种很可能在人类生物学中发挥重要作用,应该成为进一步研究的重点。仅考虑在任何样本中存在的水平大于0.01%的物种,我们在两个以上不相关的样本中发现了165种物种(补充表5)。这群优势物种包括拟杆菌(n = 41),厚壁菌门(n = 82),变形菌门(n = 27)和放线菌(n = 15)。鉴于每个门的表达丰度,这代表了来自拟杆菌的物种的显着过度呈现(P <0.05)和来自厚壁菌门的物种的显著不足(P <0.01)。
考虑到所有被检测到高于背景水平的物种,大多数优势物种仍然是拟杆菌门的成员。总而言之,前20种流行种中有8种为拟杆菌属(Bacteroides vulgatus, Bacteroidesuniformis, Bacteroides cellulosilyticus, Bacteroides ovatus,Bacteroidesxylanisolvens, Bacteroides thetaiotaomicron, Bacteroides caccae和Bacteroides dorei)。对各系统发育类群内的物种数进行校正后,拟杆菌门、拟杆菌属和Parabacteroides属(Parabacteroidesdistasonis 和Parabacteroides merdae)显著性过高(P < 0.001;图4).厚壁菌门中有3个生物超过346种,但在许多个体中高度代表性的远缘厚壁菌门只有6种(Fecalibacterium prausnitzii, Blautia obeum, Fusicatenibactersaccharivorans, Anaerostipes hadrus, Roseburia faecis 和Dorealongicatena;图4)。
图4 人体胃肠道菌群中优势菌种。优势种,按丰度排序,发现在13490个人类胃肠道宏基因组样本及其在每个样本的相对丰度。拟杆菌门(绿色),厚壁菌门(蓝色),变形杆菌门(橙色),放线菌门(金色)。
总的来说,所有在Firmicutes门内检测到的属在其发生中均未得到充分的统计描述。同样的,在样品中非常普遍的变形菌门的唯一成员是大肠杆菌,在样品中大部分变形菌未能检测到。有趣的是,没有发现Fusobacteria或Synergistetes的成员在所考虑的检测水平上普遍存在,这表明它们仅在本分析中未包括的某些条件或生命阶段中被发现。这些数据表明,拟杆菌在人类胃肠道内的特定成员可能发挥关键作用。相比之下,在另一个优势门Firmicutes中观察到的明显更大的多样性表明,这是一个高度可变的、潜在功能冗余的类群,与之前关于该类群中许多类群的孢子介导的动态传播和更替的报道一致17,24。然基于实验室的表型分析检查了许多通过本研究确定的关键物种仍然有限,但现在可以通过访问HBC中存档的分离株来解决这一问题。虽考虑到HGG中包含的各种各样的新基因组,我们接下来试图了解这些物种在整个群落中的丰度。重要的是,这些基因组的可用性使我们能够首次可靠地评估这些物种在元基因组样本中的丰度。
值得注意的是,值得注意的是,在> 100个样本中发现了近一半(87; 48.6%),但在> 1,000个样本中发现不到四分之一(39; 21.8%)。有趣的是,有趣的是,几乎一半的分析样本中都发现了梭菌属中的三种新物种。在7,797(55.9%)和7,074(50.7%)样品中分别发现了两种新的Lachnospiraceae,在6,777(48.6%)个样品中发现了一种新的Ruminococcaceae物种。总的来说,这些数据表明,通过这项工作发现的许多新物种和基因组经常出现在人类群体中,并可能代表人类胃肠道微生物群的组成部分,这值得进一步研究。
人体胃肠道细菌的功能。
这种基因组测序细菌分离物的扩展集合可实现高分辨率功能和分类学分析。我们首先在蛋白质序列上进行了一组直系同源蛋白质组(COG)注释,以鉴定HGG细菌中普遍存在的那些特征。该分析鉴定了在至少一种分离物中代表的4,696种不同的直系同源基团。正如预期的那样,细菌管家功能,包括核糖体蛋白功能,氨基酸合成和其他翻译相关功能,在细菌的30种功能中占据主导地位(补充表6)。
为了解胃肠道微生物群(Bacteroidetes,Firmicutes,Actinobacteria和Proteobacteria)的四种主要细菌门成员所发挥的功能作用的差异,我们使用主成分的判别分析(DAPC)比较了通过COG分析鉴定的4,696个直系同源组。这一对比显示了人类胃肠道菌群关键门的功能差异明显(图5)。
图5 人体胃肠道细菌功能。功能分类的DAPC分析显示,各优势门[拟杆菌门(绿色;n = 231个基因组),Firmicutes(蓝色;772个基因组),变形杆菌(橙色;n = 194个基因组),放线菌(金;n = 129个基因组)]在HGG集合内相关的功能呈明显分离状态。
接下来,我们进行富集分析,以确定相对于HGG中存在的所有功能,每个门中所表达的功能情况。该分析在Actinobacteria,Bacteroidetes,Firmicutes和Proteobacteria分别鉴定了8,122,152和389个统计学上富集的功能(q <0.001;补充表7)。Actinobacteria中的富集功能是有限的,但鉴定的那些主要与脂质(q < 1.99×10-83)和碳水化合物代谢(q <7.57×10-77)相关。对拟杆菌特异功能的等效分析发现了许多关键功能,包括铁(q < 1.18×10-114),硫转运功能(q < 6.82×10-97)和特定的钠转运NADH泛醌氧化还原酶(q < 3.47×10-124)。Firmicutes由无特色的功能主导;然而,孢子形成(q < 3.48×10−123)和硫胺素(q < 2.76×10−101)和核黄素转运(q < 7.04×10−101)都是高度富集的。最后,Proteobacteria以果糖二磷酸酶(q < 4.50×10-140),葡萄糖激酶(q < 4.55×10-125)和铁簇形成调节剂(q < 9.20×10-98)为主。最后,变形菌门weredominated果糖bisphosphatase(q < 4.50×10−140),葡糖激酶(q < 4.55×10−125)和铁集群形成的监管机构(q < 9.20×10−98)。这些结果表明,在人类胃肠道微生物群的关键门所提供的独特功能方面存在明显差异;然而,无特征功能的普遍存在进一步表明需要更好的基因组注释和功能基因组学来了解这些细菌。HGG收集的基因组来自173个以前没有从人类胃肠道分离出来的物种。这包括来自HBC内的105种新物种的基因组和来自68种已知物种的基因组,其中基因组测序的来自人胃肠道的分离物先前不存在(补充表1)。
为了解在这173种物种中发现了哪些在先前报道的基因组测序物种中不存在功能,我们进行了功能分析。共鉴定了45种新描述的功能,其中41种是在Firmicutes中发现的。虽然这些功能主要由未表征的蛋白质所主导,但新的功能包括与四水氨喋呤s -甲基转移酶(存在于5种)、蛋白前转位酶(也存在于5种)和甲醛活化酶(存在于4种以前未表征的厚壁菌门中)相关的功能。此外,根据先前定义的基因组特征,预测这些新测序分离株中的83.2%和新物种中的85.8%将形成孢子17。
最后,我们试图了解哪些功能预计会在特定门的新基因组测序成员中发生,但在该门的所有现有基因组中都不存在。最后,我们试图了解在一个特定门的新基因组序列成员中,哪些功能被预测会发生,但在该门的所有现有基因组中却没有。本分析鉴定了拟杆菌门中III型、IV型和VI型分泌系统成分,这些成分在之前测序的胃肠道拟杆菌门中均未发现,但在现有的变形杆菌门和厚壁菌门基因组中得到了识别。同样,在现有的变形杆菌基因组中发现的ABC转运蛋白功能在新测序的胃肠道壁厚菌门中得到了鉴定,但在之前测序的分离株中没有发现。
这表明在门的特定成员之间可能存在进一步的功能重叠,在微生物群落动态和宿主- 微生物群相互作用中具有潜在重要的冗余作用。
结 论
我们提供了一个胃肠道细菌基因组和培养收集,大大增加了在发达国家的宏基因组学样本中发现的物种比例。所使用的YCFA培养基使得细菌生长水平具有最初样品广泛的代表性,因此有必要将YCFA与选择性培养技术相结合以靶向特定的细菌表型;例如,抗生素耐药性、芽孢形成、碳水化合物利用和分离粪便样本中存在的稀有细菌。鸟枪基因组测序尚未对世界上的许多人群进行,因此目前还无法准确评估培养的细菌在整个人群中的比例。我们提出,需要扩大、协调和全球培养工作,特别注重从发展中国家和发达国家更多样化的社区分离的样本和细菌。与这些宏基因组样本相关的元数据的收集和存储也很重要:尽管制定了标准26,27,但是在共有序列集合中存储的许多基因组和宏基因组序列存在不正确、不一致、缺失或有限的元数据,这从根本上限制了它们的使用。除了改进了物种分类,获得完整的基因组测序分离物从根本上改变了功能分析的方法、分辨率和准确性。基因组测序的分离物使得能够从参考基因组的遗传谱中推断出功能性。这就消除了进行超深度宏基因组测序的需要,并确保了完整的功能通路包含在单个细菌中。除了提高准确性之外,这种方法还能够提高功能分析的敏感性,从而能够检测出功能,这些功能虽然不普遍,但可能代表研究群体之间的根本差异。尽管在过去的100年里,对病原体和模型生物体的广泛描述一直是微生物学研究的主要内容,但人类健康相关共生菌的研究却远远落后。正如这里所报道的,培养、基因组测序和分离存档将极大地改善基于微生物学的对人类胃肠道的分析,并有可能在其他领域得到应用28。传统的微生物学方法可以使我们继续接触到迫切需要的细菌分离物,以进行实验表征和验证,并改善我们对重要的人类相关微生物群落的理解。
你可能还喜欢