编译:微科盟朱海珍,编辑:微科盟木木夕、江舜尧。
微科盟原创微文,欢迎转发转载。
导读
喀斯特洞穴是一种分布广泛的地下生态系统,微生物在推动洞穴发育与元素的生物地化学循环中发挥重要作用。以往的研究通过非培养方法探究了洞穴生态系统中的微生物群落,但验证测序数据得出的假设及揭示微生物在洞穴生态系统中发挥的功能仍然需要进行大规模的菌株分离培养。本研究对贵州省两个喀斯特洞穴中采集的样品进行了大规模的细菌分离培养,并对其中的细菌新物种进行了全基因组测序。结合从数据库中获得的洞穴分离已知物种的基因组,构建了洞穴分离培养细菌基因组数据集。通过将构建的基因组数据集与宏基因组测序数据比较,探究了细菌在洞穴碳氮硫元素循环中的代谢潜力。在此过程中,发现洞穴细菌参与β-酮己二酸途径降解4-羟基苯甲酸的3-氧代己二酸-CoA转移酶序列聚为两簇,选择代表菌株对这两类3-氧代己二酸-CoA转移酶进行了异源表达与酶活测定。本研究报道了目前已知的最大规模的洞穴细菌资源库,为今后洞穴生物地化学研究提供了宝贵信息与资源。
原名:Bacteria and Metabolic Potential in Karst CavesRevealed by Intensive Bacterial Cultivation and Genome Assembly
译名:大规模分离培养及基因组分析揭示喀斯特洞穴细菌代谢潜力
期刊:Applied and Environmental Microbiology
IF:4.016
发表时间:2021.1
通讯作者:刘双江
通讯作者单位:中国科学院微生物研究所
本研究使用的样品采集自贵州省遵义市绥阳县宽阔水风景区的两个未开发洞穴,样品包括水、岩石、沉积物三种类型。将样品用生理盐水进行梯度稀释,涂布R2A平板,30oC培养。平板上长出的菌落挑取后划线纯化,用通用引物27F/1492R扩增近全长的16S rRNA基因测序。测序数据与NCBI的16S microbial database进行比对,以相似性97% 为标准进行物种注释。对潜在的细菌新物种使用Biolog GEN III试剂盒检测生化特征,利用透射电子显微镜观察细胞形态,使用PacBio RS II平台进行全基因组测序。基因组数据使用ChunLab’s ANI计算器计算物种间的平均核苷酸相似性,使用GGDC 2.1进行数字DNA-DNA杂交。洞穴样品的16S rRNA扩增子数据与宏基因组测序数据从NCBI的SRA中检索下载。16S rRNA扩增子数据使用VSEARCH v11.0.667进行双端合并及质控,使用QIIME v1.9.1去除非细菌序列及平均相对丰度低于0.00001的OTUs。16S rRNA扩增子代表序列与分离培养菌株16S rRNA基因序列使用BLAST+ v2.10.1进行比对。宏基因组数据使用KneadData v0.7.4进行质控,丢弃质控后序列数低于10,000的样品。使用MEGAHIT v1.2.9对质控后的数据进行组装,使用Prokka v1.14.6预测CDS,然后用CD-HIT v4.8.1构建非冗余基因集。使用Salmon v1.3.0对每个样品中的基因进行定量。分离培养群落的多样性指数使用PAST计算,主坐标分析使用vegan包,可视化使用ggplot2包。3-氧代己二酸-CoA转移酶的异源表达使用pET-28a载体与E.coli BL21菌株,酶活检测使用分光光度法。检测体系包含200 mM Tris-HCl (pH 8.0),40 mM MgCl2,10 mM 3-氧代己二酸,0.4 mM 琥珀酰-CoA,终体积为200 μl。使用酶标仪检测305 nm吸光度,借助3-氧代己二酸-CoA:Mg2+的摩尔消光系数计算产物的生成。洞穴细菌的大规模分离培养和鉴定按照图1a所示的流程进行。本研究共获得3,562株细菌,其中1,408株分离自洞穴1;2,154株分离自洞穴2。两个洞穴的洞口距离仅500米,地质及气候条件相似。以16S rRNA基因相似性97%为标准,3,562株细菌可以初步分为329个物种,属于102个属。洞穴1和洞穴2的样品中各获得225个和201个物种。其中,128个物种仅从洞穴1的样品中分离到,104个物种仅从洞穴2的样品中分离到,其它97个物种在两个洞穴的样品中都能分离到。通过香农指数分析,从两个洞穴分离的细菌群落没有显著差异(图1b, Student’s ttest, p > 0.05)。将分离自不同类型洞穴样品的细菌群落进行比较分析,不同类型样品中分离得到的细菌群落的香农指数存在显著差异(图1c, ANOVA, F =6.509, p < 0.01)。沉积物中细菌群落的α-多样性显著高于岩石样品(Tukey HSD, p < 0.05)和水样(Tukey HSD, p < 0.01)。基于Brey-Curtis距离矩阵的主坐标分析表明,三种样品中分离培养的细菌群落,其群落组成存在显著差异(PERMANOVA, F =3.06, R2 = 0.135, p = 0.001)。岩石样品中的优势类群是放线菌,沉积物样品中变形菌、放线菌和厚壁菌的分布相对均匀,水样中则是变形菌占绝对优势。129个物种分离自岩石样品,155个物种分离自沉积物样品,133个物种分离自水样。
图1 洞穴细菌分离培养流程(a)及其多样性(b,c)。将来自两个洞穴分离获得的菌株作为一个整体,其中最常分离到的是变形菌门的菌株,其次是放线菌门和厚壁菌门(图2a)。拟杆菌门和奇异球菌-栖热菌门(Deinococcus-Thermus)仅分离获得了个别菌株。在更细致的分类水平上,洞穴样品中丰度最高的是短波单胞菌属(Brevundimonas),α变形菌纲的柄杆菌属(Caulobacter)和博斯氏菌属(Bosea)、γ变形菌纲的假单胞菌属、放线菌门的链霉菌属和红球菌属(Rhodococcus)、厚壁菌门的芽孢杆菌属也占较大的比例。以16S rRNA基因相似性97%为标准,分离获得的166个菌株属于潜在的细菌新物种,占所有分离菌株的4.7%。这些新物种涉及以下各属:节杆菌(Arthrobacter)、固氮螺菌(Azospirillum)、短波单胞菌、奇异球菌(Deinococcus)、马赛菌(Massilia)、甲基养菌(Methylibium)、诺卡氏菌(Nocardioides)、新草螺菌(Noviherbaspirillum)、油单胞菌(Oleomonas)、类芽孢杆菌(Paenibacillus)、类芽孢八叠球菌(Paenisporosarcina)、池塘杆菌(Piscinibacter)、假古尔本基安菌(Pseudogulbenkiania)、假单胞菌、土壤单胞菌(Solimonas)、鞘氨醇单胞菌(Sphingomonas)及扎瓦尔金氏菌(Zavarzinia)。为了评估分离培养的细菌在整个洞穴细菌群落中的代表性,从NCBI数据库中收集了4个非培养的洞穴样品16S rRNA基因扩增子数据集。其中数据集PRJNA497480的样品采集自中国西南地区的8个喀斯特洞穴,其地质背景与本研究中的两个洞穴比较相似。这4个数据集共包含153个样品,将其OTUs的代表序列与分离获得的3,562个菌株的16S rRNA基因进行比对,分离培养的菌株平均占各数据集相对丰度的28.7%-31.1%(图2b),最高可代表样品中序列的75%以上。
图2 洞穴分离细菌的物种分布(a)及其在16S rRNA扩增子数据集中的代表性(b)。从166株潜在细菌新物种菌株中选择24个代表菌株,检查其菌落纯度,并将16S rRNA基因与最新的在线数据库(EzBioCloud和NCBI)进行比对。不幸的是,7个潜在新物种的代表菌株无法继续传代培养。菌株K2R10-124与K2W31S-24与在线数据库中的序列相似性超过98%;菌株K1W22B-3与K1W22B-8两者的16S rRNA基因相似性达99%,将其重新分类为同一个分类单元。对剩下的14个潜在新物种进行形态学观察、表型测定、系统发育分析及基因组测序。这些菌株的形态及系统发育见图3,各菌株的命名见表1。
图3 洞穴潜在细菌新物种的形态(a)及基于16S rRNA基因的系统发育关系(b)。
如图4a所示,与碳水化合物尤其是多糖相比,洞穴新物种对短链脂肪酸和氨基酸的利用更为普遍,尽管接近半数的菌株能够利用D-果糖、D-果糖-磷酸和D-葡萄糖等单糖。其它葡萄糖胺、甘油及吐温40等碳源也能够被大多数洞穴潜在新物种利用。对洞穴分离的14株潜在新物种进行了全基因组测序,获得的基因组大小从2.5 Mb到6.5 Mb,编码的蛋白质的数量为2,507到5,725个(表2)。将测序获得的基因组根据直系同源基因簇(Clusters ofOrthologous Groups, COG)进行功能分类(图4b)。在信息存储与处理方面,大多数测序菌株在转录(COG-K)、翻译(COG-J)及复制与修复(COG-L)方面的基因数量最多。在细胞过程与信号转导方面,参与细胞壁/被膜合成及信号转导方面的基因丰度较高。在代谢方面,氨基酸(COG-E)和脂质(COG-I)可能是洞穴新物种更青睐的碳源,另外,能量的产生与转换(COG-C)、无机离子转运与代谢(COG-P)在洞穴新物种的基因组中也非常丰富。值得注意的是,这些新测序的基因组中还有大量未分类的基因有待进行进一步的功能探究。
图4 洞穴潜在细菌新物种的代谢概览。图a为Biolog GEN III测得的碳源利用情况,紫色代表阳性,白色代表阴性;图b为14个新测序基因组的COGs分布情况,基因相对丰度最高的为粉色,最低的为绿色。
如图4b所示,14株测序的洞穴细菌物种中11株有鞭毛,基因组数据挖掘的结果也支持这一结果。对于生存条件复杂且营养匮乏的细菌来说,能够向有利的环境移动(趋化)对其生存至关重要。所有11株有鞭毛的菌株其基因组上都存在编码趋化受体、组氨酸激酶CheA及其受体CheW的基因,趋化受体的数量从2个(K2R01-6和K1W22B-7)到46个(K2W22B-5)不等。据报道,形成生物膜也是洞穴细菌的生存策略之一。9株新测序的菌株基因组上有与生物膜形成相关的胞外多糖生物合成的基因。近期研究表明,细菌的趋化与生物膜合成的信号转导系统存在交互作用,洞穴细菌可能通过协调其行为来适应环境。4 分离细菌基因组及宏基因组数据预测洞穴生物地化学循环相关的代谢潜力为了获得对洞穴细菌代谢潜力的宏观认识,构建了一个洞穴细菌基因组数据集。这个数据集包括新测序的14个基因组与204个数据库中获得的与本研究分离菌株相同物种的基因组。这些数据代表了整个分离培养类群的218个物种,在整个分离培养类群中的相对丰度为72.32%。CD-HIT软件从洞穴细菌基因组数据集中共识别到1,060,824个基因,聚类为一个包含857,889条代表性序列的非冗余基因集。将这个非冗余洞穴细菌基因集使用KEGG数据库进行注释,共鉴定到7,476个直系同源组(KOs)。这些基因丰度最高的是基因信息处理(14.6%)相关的,其次还有信号转导与细胞过程(11.4%)、碳水化合物代谢(9.4%)、氨基酸代谢(7.7%)、能量代谢(4.1%)等过程的相关基因。另外,本研究收集了8个喀斯特洞穴沉积物、石笋、岩石表面样品的宏基因组数据。这些功能注释结合分离菌株的相对丰度揭示了洞穴细菌独特的碳、氮、硫代谢特征。4.1碳代谢。洞穴细菌群落在有机碳利用方面,值得注意的是芳香化合物(aromatic hydrocarbon, AH)和聚羟基丁酸(poly-β-hydroxybutyrate, PHB)(图35a)。35.8%的分离培养菌株具备从乙酰辅酶A(acetyl-CoA)合成PHB的潜力,33.3%的基因组也有PHB解聚的第一个基因。以往的研究表明,石笋能够捕获多环芳烃,芳香化合物可能是洞穴生态系统重要的碳源和能源之一。在本研究的数据集中,很多基因组有通过β-酮基己二酸(beta- ketoadipate)途径降解4-羟基苯甲酸(4-hydroxy-benzoate)的一系列基因,但是在整个数据集中却没有注释到3-氧代己二酸辅酶A转移酶(3-oxoadipate CoA-transferase)基因。根据统计结果,57个基因组(平均相对丰度26%)能够氧化CO,这表明CO可能是洞穴细菌生长的重要电子供体。由于CO能够结合金属蛋白,对很多生物是有毒性的,但是CO作为电子供体,电势很高,因此在一些极端环境中可以作为重要的能源或/和能源。值得注意的是,目前唯一已培养的大气甲烷氧化菌USCα类群,即洞穴大气甲烷氧化菌USCγ在酸性环境中的对应类群,也被证实能够利用CO作为能量来源。在厌氧碳代谢中,微生物参与的CO氧化通常与乙酸或甲烷的产生过程偶联。但是在好氧条件下,也就是本研究使用的分离培养条件,CO既可以作为补充能源物质而不转化为生物质,也可以为卡尔文-本森(Calvin-Benson-Bassham,CBB)循环固定CO2提供能源。因此,本研究也统计了洞穴细菌基因组数据集中的rbcL基因,这个基因编码通过CBB途径固定CO2的Rubisco大亚基。rbcL基因存在于数据集的30个基因组中,相对丰度为14.9%。新物种油单胞菌K1W22B-8的基因组可以作为CO氧化相关的基因示例。菌株K1W22B-8基因组中的cox基因簇包含CO脱氢酶的结构基因(coxMSL)、膜结合的ATP酶基因(coxD)、参与Mo=S基团形成的类xdhC基因(coxF和coxI)。将K1W22B-8基因组上的cox基因簇与羧基营养型细菌嗜碳寡养菌(Oligotrophacarboxidovorans OM5)的基因组进行比较,K1W22B-8的基因组上缺乏将CO脱氢酶锚定在细胞质膜上的基因(coxB, coxC, coxH and coxK),这说明两个菌株的CO脱氢酶可能在细胞定位上存在差异。有趣的是,在K1W22B-8基因组上cox基因簇的上游,有一个类可溶型甲烷单加氧酶基因簇(soluble methanemonooxygenase-like gene cluster, smoXYB1C1Z)。据报道,该基因簇在某分枝杆菌菌株中表现出氧化C2到C4短链烷烃的能力。与分离培养的基因组数据集一致,宏基因组数据中与PHB合成与解聚、4HB降解及CO氧化相关的基因同样分布广泛且数量丰富(图5b)。在分离培养的基因组数据集中,参与PHB合成的三个基因在80个细菌基因组中都存在,而乙酰乙酰-CoA还原酶(PhaB,K00023)在8个洞穴宏基因组数据中都没有注释到。CO脱氢酶基因在各个洞穴宏基因组数据中的分布各不相同,采集自葡萄牙的洞穴样品展现出比其他洞穴样品更高的CO氧化潜力。4.2氮代谢。在洞穴细菌基因组数据集中,NtrC家族的双组分系统在88个细菌基因组中都存在,表明在氮代谢过程中存在密集的调控。洞穴分离细菌基因组数据集中有11个基因组有生物固氮的潜力(图5c),其中一个分离自水样的新的固氮螺菌(Azospirillum)新类群丰度较高,可作为这一功能类群的代表。固氮螺菌K2W22B-5的基因组上具备所有三个固氮的关键操纵子:nifHDK, nifENX和nifUSV,分别编码固氮酶(nitrogenase)的结构基因、固氮酶的钼辅因子和铁硫簇。与其它固氮螺菌基因组上的基因排布方式相似,在nifENX操纵子的下游有一个nif特异的铁氧还蛋白III(nif-specificferredoxin III)编码基因fdxB,在nifUSV操纵子与nifW基因(编码固氮酶稳定/保护蛋白)之间有一个编码丝氨酸O-乙酰基转移酶(serine O-acetyltransferase)的cysE基因。每固定1分子氮气要消耗16分子ATP,为了在一定程度上补偿这一耗能的过程,固氮菌有一系列氢化酶(hydrogenase)基因,氧化固氮的副产物氢气。氧气耐受的镍铁氢化酶([NiFe]-hydrogenase)在细菌中广泛存在,其编码基因hyaAB也存在与菌株K2W22B-5的基因组中。一半以上分离培养的洞穴菌株有进行异化型硝酸盐还原的潜力。菌株K2W22B-5基因组中参与异化型硝酸盐还原到亚硝酸盐的基因簇是napABCDE,它编码位于周质空间的硝酸盐还原酶;但是数据集中其它基因组中跟多的是narGHI,编码能够在还原反应过程中产生质子驱动力的膜结合的硝酸盐还原酶。菌株K2W22B-5基因组中参与异化型亚硝酸盐还原成氨的基因簇是nirBD,编码硝酸盐/亚硝酸盐转运蛋白的基因是nrtABCD。对洞穴宏基因组数据的分析没有找到完整的异化型硝酸盐还原酶(图5d)。这些数据集有些缺少膜结合的硝酸盐还原酶(Nar I,K00374)的γ亚基,有些缺少周质空间硝酸盐还原酶(Nap B,K02568)的电子传递亚基。亚硝酸盐还原相关的基因在所有8个宏基因组数据集中都广泛存在且数量丰富。固氮酶基因在各个洞穴宏基因组数据中的分布各不相同,采集自夏威夷的洞穴样品展现出比其他洞穴样品更高的固氮潜力。4.3硫代谢。尽管洞穴分离菌株基因组的数据集中没有参与异化型硫酸盐还原的基因,洞穴细菌基因组数据集与洞穴宏基因组数据中都有参与同化型硫酸盐/亚硫酸盐还原及硫代硫酸盐还原到硫化氢的基因(图5e和5f)。在洞穴细菌基因组数据集中,71.1%的菌株有将硫代硫酸盐氧化成亚硫酸盐的潜力,36.1%的菌株有氧化亚硫酸盐的潜力。
图5 洞穴细菌基因组数据集(a,c,e)及洞穴宏基因组数据(b,d,f)与C/N/S循环相关的代谢潜力。图a,c,e中不同颜色的箭头表示不同功能类型的物质转化过程,箭头的粗细与能进行该转化步骤的物种数相关,虚线表示数据集中没有进行该转化步骤的基因,箭头上的数字和百分比分别表示能进行该转化步骤的物种数及其相对丰度;图b,d,f中的基因根据TPM值着色。5 洞穴细菌基因组数据集中“丢失的”3-氧代己二酸-CoA转移酶的鉴定根据前面的预测,芳香化合物降解的β-酮己二酸途径在洞穴分离细菌基因组数据集及宏基因组数据中都普遍存在且丰度较高。然而,编码3-氧代己二酸-CoA转移酶的基因(pcaIJ)在分离细菌基因组数据集中没有注释到。用宏基因组数据中注释到的pcaIJ基因与分离细菌基因组数据集进行比对,比对到16个序列相似性大于47%的基因,这些基因可能是潜在的pcaIJ。根据NCBI及KEGG注释,人工检查了基因组数据集,筛选出所有参与β-酮己二酸途径的连续的基因簇,共获得55个基因组可能携带潜在的3-氧代己二酸-CoA转移酶编码基因。代表菌株K2W22B-5及K1R23-30中的相关基因分布如图6a所示。pcaI和pcaJ分别编码3-氧代己二酸-CoA转移酶的两个亚基,将这两个基因从55个基因组中提取出来,将两者串联起来进行系统发育分析。结果表明,潜在的3-氧代己二酸-CoA转移酶聚成两个大的分支,其中Cluster I包含26个潜在的基因,主要来源于研究较多的假单胞菌;Cluster II包含29个潜在的基因,物种来源比较多样(图6c)。从两个分支中各选择一个代表菌株,对其潜在的pcaIJ基因进行异源表达纯化,得到的产物均表现出3-氧代己二酸-CoA转移酶活性(图6d)。
图6 β-酮己二酸途径相关基因(a)及其物质转化过程(b),3-氧代己二酸-CoA转移酶编码基因聚类(c)及其代表序列的酶活测定(d)。图a中的红色百分比表示洞穴分离菌株与ATCC 35469对应酶的氨基酸序列相似性;图d中的对照包含三种情况:检测体系不加酶,检测体系加K5PcaIJ不加琥珀酰-CoA,检测体系加30PcaIJ不加琥珀酰-CoA。以往研究表明,对洞穴微生物的分离培养存在挑战,因为营养丰富的培养基会对适应寡营养洞穴的细胞造成渗透压力。为了更好地分离培养洞穴细菌,本工作选择了R2A培养基。据报道,营养物质浓度较低的R2A在尽可能多地培养异养菌时比PCA培养基和TSA培养基更有优势。与常用的基于形态差异的分离培养方法不同,本工作挑取了尽可能多的菌落,使得物种丰度在一定程度上是有意义的。尽管将培养基进行稀释、采用更低的培养温度、延长培养时间等方法也许能够获得更多的细菌物种,但本研究仍然获得了一个很大的洞穴细菌资源库。通过与16S rRNA基因扩增子测序数据比较,分离获得的菌株代表了整个洞穴细菌群落的主要部分。本研究分离频率最高的是变形菌门、放线菌门和厚壁菌门的菌株,也获得了拟杆菌门和奇异球菌-栖热菌门的个别菌株。在属水平上,短波单胞菌是本工作中最常分离到的类群,也是墨西哥另一寡营养洞穴中的典型代表菌株。尽管本研究采样的两个洞穴没有进行过旅游开发,但分离获得了大量芽孢杆菌和类芽孢杆菌,这些类群在其它开放洞穴的研究中也有报道。微生物代谢是洞穴生态系统生物地化学循环的重要驱动力。非培养的方法预测了洞穴微生物群落的代谢潜力,但尚未解决哪些微生物发挥哪些功能的问题。本研究结合基因组测序与数据库挖掘,构建了包含218个洞穴分离细菌基因组的数据集,并解析了其在C/N/S循环过程中的代谢潜力特征。例如,洞穴新物种油单胞菌及固氮螺菌的CO氧化与固氮潜力可能减轻了洞穴环境的碳氮匮乏。在营养条件受限的环境中,微生物被迫利用一切可以获得的营养物质生存。据报道,Movile洞穴中的很多细菌都能利用C1化合物生长。除了油单胞菌,本研究也获得了一些兼性甲基营养型的菌株。近年来,存在于洞穴环境中的一个未培养的大气甲烷氧化类群备受关注。尽管油单胞菌的甲烷氧化能力没有验证,但这些菌株存在氧化C2-C4化合物的潜力,为探究洞穴微生物烷烃氧化提供了新的角度。
β-酮己二酸途径广泛存在于土壤细菌和真菌中,但喀斯特洞穴微生物参与该途径的潜力尚未报道。本研究在洞穴细菌基因组数据集及宏基因组数据集中均观察到大量参与β-酮己二酸途径的基因,并进一步验证了该途径中两类3-氧代己二酸-CoA转移酶的活性。这些结果展示了传统分离培养与测序数据结合的强大力量,新表征的pcaIJ基因也将为提高测序数据的准确性提供有价值的信息。