科研 | Water Research: 宏基因组比较分析揭示了灌溉原生和再生水微生物分类和功能
![](http://n4.ikafan.com/assetsj/blank.gif)
编译:ye00ye,编辑:小菌菌、江舜尧。
原创微文,欢迎转发转载。
背景:使用原始水和再生水作为灌溉用水可以帮助减轻地下水过度使用带来的负面影响。然而,针对这两类水中微生物的物种和功能的组成差别在时间空间上的变化还少有人研究。为了弥补这个缺口,本研究利用宏基因组技术做了相关调查。
研究材料:本研究以亚特兰大中部地区的农用淡水池塘(2块)、淡水溪流(2条)、咸水河流(2条)、水再生处理厂(3个)等设施中的水为研究对象,在2016年10月到11月间共采集24个水样。
实验方法:水样用0.2μm滤膜处理后,用滤膜进行DNA提取,随后进行宏基因组测序并进行后续分析。
结果:在淡水采集点中,β变形杆菌占优势地位,而在咸水河中,α变形杆菌有时占优势地位。在其中一条咸水河中,发现有大量的Gimesia和微囊藻(Microcystis)属物种。而且,预估的微生物性状(ARGs和CRISPR)随着采样地点和时间的变化而有所不同。ARGs在不同样本中存在,其最高多样性和丰度分别在一个回用水厂和一个受到污染的淡水溪流中检测到。600个CRISPR序列得到鉴定,其中包含约2600独特的定位器序列,显示群落中存在多样的地点特异的噬菌体类群。
结论:本研究帮助增进了对原水和再生水的微生物群落结构多样性的理解,提示这两类水用于灌溉对环境和人类健康可能造成影响。
论文ID
原名:Comparative metagenomic analysis of microbial taxonomic and functional variations inuntreated surface and reclaimed waters used in irrigation applications
译名:灌溉用原生和再生水微生物分类和功能编译的比较宏基因组分析
期刊:Water Research
IF:7.913
发表时间:2020.02
通讯作者:AmyR.Saplota
作者单位:马里兰大学公共健康学院马里兰应用环境健康研究所
实验设计
采样点:位于美国马里兰州的四个不同类型的水体:2条咸水河(MA04,MA08);2个淡水池塘(MA10,MA11);2个不受潮汐影响的淡水溪流(MA03,MA07);3个再生水处理厂(MA01,MA02,MA06),共采集24个样品。
采样日期:所有样品采集于以下三个日期(10/10/16、10/24/16、11/14/16),其中三个再生水厂只在10/24/16、11/14/16后面两个日期采样。
样品采集:淡水和咸水水体样品收集于水面以下15-30cm,再生厂的水样根据情况采集于水龙头、灌溉线或者蓄水池。每个样三个平行,记录了水温、pH和环境温度等指标。
样品处理:样品过0.2μm滤膜,拿滤膜提取DNA,纯化,NanoDrop测量浓度和纯度。
宏基因组测序:使用Illumina Hiseq X10 flow进行双端测序
宏基因组组装:使用Trimmomatic ver.0.36进行质控,FLASHver.1.2.11进行序列合并,metaSPAdes ver.3.10.1进行组装,利用MetaGene预测ORFs,并翻译出对应的多肽。
物种和功能注释:可翻译多肽ORGs利用BLASTp进行UniRef100数据库比对。功能注释参考GO层级注释
ORF聚类:利用CD-HIT对所有ORGs进行60%相似性聚类
抗性基因鉴定:利用BLASTp对ORFs进行CARD数据库比对
结果
所有样品经过测序后,共得到803,403,499条成对序列,平均每个样品有33,475,146条(+/-SD9,122,444)。经过组装获得50%的合格序列(总共11,383,477条,平均474,310+/-150,989SD条序列),约48%的序列长度大于500bp。
经过BLAST,平均65%的序列能被准确注释。其中,78%到98%(平均91%)的序列被确定为细菌,真核生物为0.6%到17%(平均4%),其次为病毒(0.6%到10%,平均3%)。对于无法鉴定的物种,确认了其丰度。在真核生物中,主要物种为链形植物(Streptophyta,6%~51%,平均21%),节足动物门(Arthropoda,6%~43%,平均15%),脊索动物门(Chordata,8%~30%,平均15%)。
对于细菌物种,丰度最高的门是变形杆菌门(35%~83%,平均55%)(图1A)。其次是放线菌门(2%~25%,平均13%)、拟杆菌门(6%~21%,平均13%)和厚壁菌门(4%~12%,平均7%)。在变形杆菌门,β变形杆菌纲在几乎每个采集点都占最高丰度,除了10/24/16和11/14/16的咸水河MA04的样品和11/14/16的MA08的样品,在这些样品中发现α变形杆菌纲占最高丰度(图1B)。
图2展示了样品在属水平的组成。74%~90%的序列可以被注释到属水平。总共有2,207个属,其中789个属在所有样品中存在。44个相对丰度≥1%的属至少存在于1个样品中。大多数采样点中占优势地位的都是同样的属。还有些属根据采样点不同而被清晰划分开。比如,贪噬菌属(Variovorax)在24个样品中丰度最高(2%~32%,平均11%)。而在淡水MA10中的所有样品,还有10/24/16的再生厂MA01的样品中链霉菌属(Streptomyces)占最高丰度。在淡水溪流(MA03,11/14/16)和咸水河(MA04,10/10/16)的样品中,极小单胞菌(Pusillimonas)占最高丰度;而同样是MA04,在10/24/16的样品中,念珠藻属(Nostoc)占最高丰度。
不同地点间,优势属之间存在显著丰度不同的是根瘤菌属(Mesorhizobium),囊胞杆菌属(Cystobacter),微枝形杆菌属(Microvirga),微囊藻属(Microcystis),Gimesia和原绿球藻(Prochlorococcus)。其中,咸水河MA04在Gimesia和微囊藻属的丰度显著高于除了MA01外的其它样品。而MA01在原绿球藻的丰度显著高于除了MA04外的其它样品。
![](http://n4.ikafan.com/assetsj/blank.gif)
![](http://n4.ikafan.com/assetsj/blank.gif)
平均有56%(31%~75%)的可翻译ORFs被至少注释到一个GO层级。主要来自于细菌序列(81%~98%,平均93%)。总体来看,来自不同水样、被注释到的序列的分子功能和生物过程大体相似。GO层级注释频率最高的有:转移酶活性(GO:0016740)(25%~29%,平均27%),水解酶活性(GO:0016787)(25%~27%,平均26%),ATP相关(GO:0005524)(18%~25%,平均20%),氧化还原过程(GO:0055114)(17%~20%,平均18%),催化活性(GO:0003824)(15%~18%,平均17%)(图3A)。
此外,还利用GO中的病理相关的信息对ORFs进行注释。发现序列也被注释到GO病原相关的至少一个层级(图3B)。病原相关层级被最多的序列注释到(0.7%~4%,平均2%),主要被注释到假单胞菌(6%~14%,平均9%)和极小单胞菌(Pusillimonas)(1%~12%,平均5%)。病理相关的序列主要来自于采集于11/14/16的MA03,但是不同采样点之间的样本并没有统计学上的显著差异。
![](http://n4.ikafan.com/assetsj/blank.gif)
对ORF进行60%相似性聚类来评估不同采样点之间共享的和各自独有的功能谱系(图S2,表S5)。聚类结果发现,ORFs主要根据采集点被聚在一起。占有最多独享ORFs的是来自2个潮汐咸水河MA04和MA08的样品,分别为:63%和51%。其次为MA07(48%)、MA11(41%)、MA03(36%)、MA02(36%)、MA01(34%)、MA10(33%)和MA06(31%)。此外,51%、41%和38%的来自于再生厂MA02、MA06和MA01的ORFs与MA11、MA10、MA10聚在一起。除了MA10,来自MA06的大部分ORFs(47%)与非潮汐淡水溪流MA03聚在一起。
除了上述在两个不同采样点之间交叉存在之外,4%到9%的ORFs至少跟另外其它采样点中的一个聚在一起,这说明样品中存在功能核心物种。其中,92%的核心ORFs被注释到GO项目。与功能分析相似,注释到GO项目的主要是转移酶活(GO:0016740,23%),氧化还原过程(GO:0055114,20%)、水解酶活(GO:0016787,323 19%)、翻译(GO:0006412,18%)和金属离子结合(GO:0046872,18%)。这说明丰度最高的功能为不同采集点的微生物所共享。除此之外,高丰度的细胞组分相关的ORFs也存在于这些核心物种中,如膜(GO:0016020,24%),膜组分(GO:0016021,22%)和细胞质 (GO:0005737,21%)。
对ORFs进行CARD比对。114个ORFs比对到32个ARGs,包括10个药物分类水平,涵盖从突变位点的抗药机制到具体的抗生素抗性基因产物。总体来讲,再生水厂MA06的11/14/161的样品包含的ARGs多样性最高,达22个(图4)。其次是非潮汐的淡水溪流MA03的10/24/16的样品,有13。而另一个非潮汐淡水样品MA03仅有一个ARGs,多样性最低。
对ARGs相关ORFs所属物种进行属和门归类,结果如图5。所有抗性基因相关的ORFs均来自于细菌,贡献最大的是放线菌门(占了114个中的59个,52%)。而主要抗性基因为rpsL。放线菌属物种也与另外12中独特的ARGs相关。另外,31个耐药相关ORGs被归类到变形杆菌门(11个属于α,6个属于β,14个属于γ),有26个独特的ARGs,具有相当高的多样性。
![](http://n4.ikafan.com/assetsj/blank.gif)
![](http://n4.ikafan.com/assetsj/blank.gif)
研究使用CRISPR阵列确定不同采集点之间噬菌体宿主相互关系。最后确定有612个CRISPR 阵列存在于604个序列上。图6A显示了具有CRISPR阵列的序列丰度。总的来说,拥有CRISPR的序列仅占全部序列的0.003%到0.04%。然而,平均来讲,潮汐咸水采样点MA04不仅具有最多的CRISPR阵列,还具有最高的包含CRISPR阵列的序列丰度。
使用BLASTp对包含CRISPR阵列的序列进行物种比对。结果显示,仅有22%的CRISPR相关的序列能被注释到,其中主要被分类到变形杆菌门(45%,38%属于γ纲,29%属于α纲,17%属于β纲),其次是厚壁菌门(21%)和蓝藻菌门(11%)。
对各采样点的定位器序列进行97%相似性聚类。发现咸水河MA04不仅有最多的CRISPR阵列,也包含最多的定位器序列(1173),其次是MA10(398),MA11(321),MA01(293),MA06(269),MA03(124),MA08 (161),MA07(25)和MA02(21) (图6B)。将这些定位器序列放在一起进行聚类,发现池塘和再生厂有最高的相似性,MA01和MA10共享最多的定位器序列(69个)。
![](http://n4.ikafan.com/assetsj/blank.gif)
图6:CRISPR阵列丰度和定位器序列在原水和再生水水样中或水样内部重叠展示。(A)包含CRISPR阵列的序列经标准化后的柱状图。柱子的颜色由水样类型决定,数字代表包含CRISPR阵列的序列条数。(B)不同水样采集点之间共享定位器序列(97%)的网络分布。环状节点代表9个采样点。节点尺寸代表该采样点定位器序列的数量,颜色代表水的类型。环状节点之间的节点代表CIA样点之间共享的定位器序列。
讨论
灌溉用水是淡水产品微生物污染的最大来源。保证灌溉用水的水质对于环境和人类健康至关重用。因此,调查灌溉用水替代水源中微生物的多样性很有必要。
在微生物的组成方面,差异最大的是淡水和咸水水体(图1,2,S2)。这很有可能是由于淡水和海水混合进入咸水河流后,引起两地物种在新环境的定殖。海水的汇入可能筛选下来高耐盐物种。这可能带来威胁:产肝脏毒素的微囊藻(Microcystis)可能形成生物聚集。
除了微囊藻,在所有样品中还发现了跟人类疾病相关的属(如链球菌属、肠球菌属),其中丰度最高的是贪噬菌属(Variovorax)(图2)。贪噬菌属属于从毛单胞菌科(Comamonadaceae),进化关系上接近噬酸菌属(Acidovorax),它可以降解包括一些污染物在内的很多有机物,使得它可以竞争过外来物种,且在环境中分布广泛。
在耐药基因方面,研究发现最高的ARG多样性来自于水再生厂MA06和非潮汐淡水溪流MA03(图4)。在MA06,大多数ARGs跟临床和农业用途的抗生素相关,涵盖了各种不同的抗性机制。其中,在水再生厂中发现的丰度最高的ARGs是ermF,具有对大环内酯类、林可酰胺和链阳霉素类抗生素抗性。这些抗生素经常被用于革兰氏阳性菌的治疗,并且在污水处理厂的出水中占高丰度。
在淡水溪流MA03中也检测到了高ARG多样性。这可能是由于上游的污水处理厂排水导致。有很多研究显示污水处理厂的排出水可能增加下游抗性基因、抗性菌和抗生素的存在。基于此,这些灌溉水源可能会引起的问题还需要进一步调查。
本次样品中主要的抗性基因为rpsL,该基因突变体对氨基糖苷类抗生素(如链霉素)有抗性。该突变体通过抗生素与核糖体蛋白的相互作用来产生抗性。这种靶位点突变体常见于环境细菌。实际上,尽管病原相关的细菌物种(如Listeria, Vibrio, Escherichia)被确定为一些ARGs的潜在宿主,大多数ARG宿主属于传统的环境物种(图5)。研究显示ARGs可以通过水平基因转移从环境宿主传播给病原菌,这种ARGs交换不得不引起人们的担忧。
在噬菌体方面,研究发现,CRISPR防御体系存在于水面和再生水中。而潮汐咸水河流MA04,占有最高丰度的CRISPR阵列(图6)。如前所述,海水进入该地点对选择性改变了群落结构,提高了微囊藻的丰度(图2,S2)。
在CRISPR阵列中,大多数定位器序列具有地点特异性,暗示噬菌体和宿主存在空间上的相互作用。这可能是由于本地菌适应了本地噬菌体。由此可以推测定位器序列可以作为分子印迹对细菌进行再分类以及追踪病原菌爆发。然而,样本之间也共享定位器序列,如MA01和MA10。或许物种组成上的相似性可以用于指示相近的细菌血缘关系和/或环境暴露水平。
研究的局限性。对于再生水和原水用于灌溉方案的可行性,重要的是要调查清楚其对环境健康和食品安全的风险。本研究尽管提供了一些有价值的基础性的数据,还是存在局限性。由于宏基因组测序技术的限制和数据库的有待完善,还是、有很多序列无法被准确进行物种和功能注释。因此,在本研究中,我们使用BLAST这个广泛标准相似性搜索工具和最全面的非冗余数据库,来保证我们注释的准确性。另外,因为资金缺乏,我们的研究只能进行短短2年,采集有限的样本。因此,对于物种在时间上的波动我们理解有限。
结论
本研究的目的是增加对不同灌溉水源水体中的更加全面、基础的理解,达到阐述其对作物安全和公众健康的风险这一最终目的。主要结论如下:
1、样本因时间和采样点不同而呈现高度多样性。
2、受到海水影响的采样点在物种和功能上具有最高的多样性。
3、潜在的公共健康威胁因素,如ARGs,在水再生厂和受到上游污水处理厂排水影响的淡水溪流中占有最高的丰度和多样性。
4、在水池和水再生厂间共享的高丰度的CRISPR定位序列显示相似的环境限制和噬菌体-宿主关系。
![](http://n4.ikafan.com/assetsj/blank.gif)
你可能还喜欢
![](http://n4.ikafan.com/assetsj/blank.gif)