科研 | 中山大学Water Research: 宿主相关遗传标记在中国微生物源追踪中的应用
编译:傻狍子,编辑:小菌菌、江舜尧。
原创微文,欢迎转发转载。
在过去的十年中,已经开发了许多遗传标记来建立微生物来源追踪分析(MST)。然而,由于缺乏对其基本因素(如敏感性,特异性和靶标/非靶标宿主中的浓度)的了解,因此对选择合适的标记物具有挑战性,特别是在东亚地区。在这项研究中,从中国28个城市收集了共506个粪便样本,主要包括人类和12个非人类宿主,基于二进制(存在/不存在)标准测试了40个与宿主相关的标记,用定性和定量的方法对其标记物功能进行了测试。结果表明,有15种标记(与人类有关的7种,与猪有关的4种,与反刍动物有关的3种,以及与家禽有关的1种)显示了在我们研究区域中的潜在适用性。然后使用定性和定量方法对所选的15种标记物进行测试以表征其性能。总体而言,与其它细菌或病毒标志物相比,Bacteroidales标志物在靶标样品中具有更高的灵敏度和浓度,但特异性较低。在非目标样本研究中,宠物分别占与人类相关,和与家禽相关标志物交叉反应的43.7%和35.7%。马和驴等非常见动物与反刍动物相关标记的交叉反应占61.3%。定量分析标记物时,非目标样品中的标记物浓度比目标样品中的浓度低1-3个数量级。此外,提出了一种新颖的分类方法,将非目标宿主分为“无交叉反应性”,“弱交叉反应性”,“中度交叉反应性”和“强交叉反应性”动物宿主四类。有77.9%的非靶标样品被鉴定为无交叉反应性和弱交叉反应性宿主,表明这些非靶标宿主对相应标记物的干扰很小。这项研究用定性和定量的方法阐明了中国各地宿主相关标记的表现,并揭示了非靶标动物对遗传标记的交叉反应的干扰程度,这将有助于在中国追踪多种粪便污染源并采取及时的补救策略。
论文ID
原名:Performance of host-associated genetic markers for microbial source tracking in China
译名:宿主相关遗传标记在中国微生物源追踪中的应用
期刊:Water Research
IF:7.051
发表时间:2020.2.26
通讯作者: 林凯荣,吴仁人
通讯作者单位:中山大学,生态环境部华南环境科学研究所
实验设计
本实验收集人类志愿者和非人类宿主共506个粪便样本。取样的城市如图1所示。取样地点大多数分布在中国的七个主要河流系统中,以及拉萨和乌鲁木齐等城市。遵循黑河—腾冲地界标界线,在中国东南部选择了22个采样城市。这是由于这些城市占中国人口的绝大多数,因此对附近的流域造成了更多的粪便污染。总共收集了506份粪便样本,其中117份来自人类,其中76份来自猪,102份来自反刍动物(包括牛,绵羊和骆驼),104份来自禽类(包括鸡,鸭和鹅),70份来自普通动物,宠物(包括狗,猫和兔子),以及37种不常见的动物(包括马和驴)。使用60mL无菌管收集所有粪便样品。立即将收集的样品放入密封的冰箱中,然后运输到实验室,避免阳光直射。到达实验室后,将粪便样品保存在-80℃直至提取出DNA。使用TIANamp Stool DNA试剂盒从所有粪便样品中提取基因组DNA。使用NanoDrop ND 1000紫外分光光度计测量基因组DNA的浓度和质量。纯化提取物中的DNA浓度在15至120 ng/µL之间。所有qPCR反应均在RocheLightCycler®480 II系统上进行三次。进行了一般的Bacteroidetes标记,AllBac分析以确认DNA模板的扩增和PCR抑制的缺失。我们进行遗传标记(21个与人类相关,8个与猪相关,7个反刍动物相关,以及4个与家禽相关的),以及Bacteroidetes标记。标记物的灵敏度和特异性大于50%。在这40个标记中,只有15个符合该标准的标记,包括7个与人相关的,4个与猪相关的,3个与反刍动物相关的和1个与家禽相关的(表1)。这15个标记的定量分析基于质粒标准稀释液。用各自的靶PCR产物和引物制备用于不同宿主的质粒DNA。pGEM®-TEasy Vector被用作crAssphage标记。所有其它测定均使用pMD 19-T载体进行。所有测定的标准曲线是使用质粒DNA的七个10倍系列稀释液生成的。产生的qPCR效率在90%至110%之间,以99%的置信区间计算单个标记的检测限(LOD)。在不同板中测试了每种标记的102和103拷贝稀释的阳性对照的两种标准品。103拷贝标准品的平均变异系数(%CV)为3.87±0.87%,102拷贝标准品的平均变异系数为3.75±0.80%。敏感性(r)和特异性(s)根据方程式确定。我们采用“第25/75”指标将非目标动物标记物的特异性分为4组。通过从每种标记物的目标宿主的25%浓度中减去非目标宿主的75%浓度来确定25th/75th指标。这四分别组是:(1)“无交叉反应性”(NCR),该标记物在非靶标动物中未产生任何阳性信号;(2)“弱交叉反应性”(WCR),第25/75度量标准为正值;(3)“中度交叉反应”(MCR),第25/75指标为负值;(4)“强交叉反应性”(SCR),目标样品和非目标样品的平均浓度之间的差异小于1个数量级。
图1 中国的抽样城市。红色三角形代表抽样城市。白线是黑河腾冲地界标界线。位于分界线以东的城市占中国人口的绝大多数。
表1 第二个测试阶段中所选qPCR分析的引物和探针信息。
结果
为了了解在广泛的地理区域中应用标记的潜在挑战,在本研究的后续分析中主要讨论了15种有前途的预选标记的性能。有趣的是,定性结果分析不仅在牛样品中检测到了牛特有的细菌Bac708和BacCow,而且在绵羊和骆驼样品中也很普遍。因此,将BacCow和BoBac视为反刍动物相关标记,而不是牛特异性标记。
1. 定性分析
所有测试标记物的灵敏度范围为61%至100%(表2)。其中,与人类相关的标记具有最高的敏感性(61–98%),其次是与猪相关的标记(68–100%)。相反,反刍动物相关标记的敏感性在96-100%的范围内。在人类相关标记中,包括BacH,BacHum和SYBR-HF183在内的细菌科标记是最普遍的遗传标记,其宿主敏感度分别为98%,82%和74%。线粒体DNA标记(Hum2,Hum 163)和胆管噬菌体标记(CPQ_056,CPQ_064)显示出相对较低的敏感性(59–67%)。此外,与猪乳杆菌标记物(Pig-1-Bac,Pig-2-Bac)和线粒体标记物(P.ND5)相比,乳酸杆菌标记物(68%)具有更高的敏感性(95-100%)。与其他与宿主相关的标记相比,所有与反刍动物相关的标记均以细菌为目标,并在目标样品中显示出最高的流行率。不幸的是,在初步筛选中我们只选择了一种禽类相关标志物(GFD)进行研究,该标志物的敏感性(68%)与其他细菌类标志物相比较低。
被评估标记的特异性范围为50%-91%。没有标志物表现出绝对的宿主特异性。但是除Pig-1-Bac,Rum-2-Bac和Bac708外,大多数与宿主相关的标记物与非靶标样品的交叉反应性有限。与人类相关的标记物表现出最高数量关于与宠物相关的假阳性(即7个与人类相关的标记物测试为阳性的宠物样本中有43.7%)。类似地,宠物还向家禽相关标记GFD贡献了许多假阳性信号(即,测试的GFD标记为阳性的宠物样品中有35.7%)。同样,反刍动物相关标记与非常见的动物(马和驴)假阳性呈现最高的数量,其中61.3%的非常见动物样品的反刍动物相关标记呈阳性。
在人类相关标记中,与线粒体DNA标记和crAssphage标记相比,Bacteroidales标记表现出较低的特异性。这种趋势对于BacH和BacHum尤其如此,它们分别显示出51%和55%的宿主特异性值。在与猪相关的标记中,Pig-2-Bac和P.ND5的特异性值均>0.90,但与其它与猪相关的标记相比,Pig-1-Bac的特异性相对较低(68%)。反刍动物相关标志物均表现出较低的特异性(<80%),尤其是Bac708,其特异性仅为50%。相比之下,与其他宿主相关标记相比,GFD显示出最高的特异性(91%)。总体而言,MST标记物的敏感性和特异性之间存在明显的权衡取舍,因此一个指标的增加通常会转化为另一个指标的减少。
表2 在源物种或源组中带有特定引物的qPCR阳性的数量
2. 定量分析
如之前的研究所述,每克湿粪便中的标志物的丰度被表征。根据第25/75个百分位数和平均浓度评估目标样品和非目标样品中标志物的丰度。在目标标记物中,人类相关标志物的平均浓度范围从3.57±0.77 log10GC/g至5.27±1.25 log10 GC/g,而猪相关标志物的范围从4.99±1.79 log10 GC/g至6.58 ±1.59 log10 GC/g。反刍动物相关标记的最高浓度范围从6.19±1.26 log10 GC/g至7.15±0.89 log10 GC/g。家禽相关标记物GFD在目标样品中显示出相对较低的浓度(4.09±0.96 log10 GC / g)。与大多数其他标记相比,Bacteroidales标记通常在目标样品中呈现出更高的浓度(配对t检验,p <0.05)。此外,目标样品中测试标记物的浓度分布范围更广,标记物浓度的第25和第75个百分位数相隔1-4个数量级(图2)。在人类相关标记中,Bacteroidales标记的第25和第75个百分位点相距3-4个数量级,这表明与线粒体DNA和crAssphage标记相比,具有分布较广的特点。相比之下,所有反刍动物相关标记物的第25位和第75位百分位分布都相对较窄,相距1-3个数量级。猪相关标记的第25和第75个百分位点相距1-4个数量级,而Bacteroidales标记的第25个和第75个百分位点分布仅显示了1-2个数量级。家禽相关标记GFD的第25和第75个百分位数仅相差2个数量级。
非目标样品中15种与宿主相关的标记物的浓度被测定。非目标样品中的平均浓度范围从Hum163的2.48±0.48 log10 GC / g到BacCow的4.09±0.90 log10 GC/ g,这表明非目标样品中的标志物浓度比目标样品低近了1-3个数量级。在非目标样品中,标记的第25和第75个百分位仅分离了1-2个数量级,这些结果表明非目标样品中标记的分布相对有限(图2)。为了研究不同非靶标动物对标志物浓度的贡献,基于相应的标准曲线计算了每个非靶标宿主中标志物的分布。
3. 非目标样品的分类
根据非目标样本中假阳性的分布,我们将非目标宿主分为4组(图3)。文中显示了每种标记物的无交叉反应性(NCR),弱交叉反应性(WCR),中等交叉反应性(MCR)和强交叉反应性(SCR)的浓度范围。所述分类的结果表明,有47.1%的非靶标动物被划为弱交叉反应性(WCR)类,而30.8%的动物属于无交叉反应性(NCR)。中度交叉反应等级(MCR,14.5%)和强交叉反应等级(SCR,7.6%)的频率要低得多(图3)。总体而言,这种分类方法表明发现大多数非目标样品(77.9%)对MST分析(WCR和NCR)几乎没有影响。在人类和非人类宿主之间,WCR和SCR的分布明显的不同(配对t检验,p <0.05)。例如,在人类相关标记物中40.5%的非目标宿主被归类为NCR。但是,在非人类相关标记中,有52.9%的非目标样品被归类为WCR。较少的非目标动物宿主容易受到严重影响。在人类相关标记中,Bacteroidales和线粒体标记导致兔子样品中的平均浓度较高(BacHum为5.37±1.03 log10 GC / g,Hum163为3.11±0.72 log10 GC/ g),与目标样品相似。此外,在反刍动物相关标记Bac708和BacCow中,来自驴的假阳性信号水平与反刍动物粪便样品的水平相似。
图3 每个宿主相关标记物的非靶标样品分类。根据标准对结果进行标记颜色:NCR(无交叉反应性),未扩增假阳性信号;WCR(弱交叉反应性),第25/75个指标为正值;MCR(中度交叉反应),第25/75个指标为负值;SCR(强交叉反应性),目标样品与非目标样品之间的平均浓度差异小于1个数量级。
讨论
1. 在区域范围之外评估遗传标记
从初步的文献综述中选择跨越广泛地理区域的合适遗传标记,而不是对一系列遗传标记进行盲目验证研究。当超出最初开发标记的区域范围进行验证研究时,标记的性能通常会急剧下降。此外,很难同时满足> 80%的敏感性和特异性要求,这时该标记被认为是有用的。例如,先前发表的研究报告BacH和BacHum是表现最好的标记,但在我们的研究中确表现较差。研究发现,即使在跨越16个国家/地区的研究范围内,BacH和BacHum的特异性分别为53%和68%。几种可能的因素,例如饮食,气候,动物健康和生活方式的不同,可能导致遗传标记的表现不一致。此外,不同的DNA分离程序和qPCR参数(例如qPCR试剂,DNA载量)是其它不可忽视的影响因素,这也可能导致在不同位置观察到的可变结果。例如,在验证BacH,BacHum和BacCow时,在我们的研究中所有qPCR反应的总体积为20 µL,而先前的研究则以25 µL的总体积进行qPCR反应,qPCR分析的温度设置在这些研究中也有所不同。这种差异是由于每个研究使用了不同的成分,导致了不同的qPCR方案并影响了这些标记的性能。因此,我们假设没有一个单一的性能阈值可以决定遗传标记在广泛区域中对MST的适用性。而是,性能可能会受到每个MST挑战以及每个特定研究区域中存在的条件的影响。
2. 源灵敏度的变化
目标样品中与宿主相关的标记物浓度的定量数据对于检测其在水生环境中的存在至关重要。先前研究表明,如果标记物具有较高的定性敏感性,但其定量敏感性(即目标样品中的丰度)较低,则它们不太可能检测出水样中的粪便污染,可能是因为稀释而低估污染程度或者样品处理步骤造成的损失。根据我们的结果,我们认为灵敏度也可能与目标样品中特定标记物的浓度呈正相关。例如,与人类相关的标记Hum2,Hum163,CPQ_056和CPQ_064表现出较低的敏感性(59–67%),并且它们在目标样品中的浓度也比其它与人类相关的标记物低1-3个数量级。先前的研究报告了类似的趋势,该研究评估了新加坡和澳大利亚的人类相关标记的表现。这些观察结果表明,标记物的平均浓度越高,在目标宿主中获得高于LOD的真实阳性信号的可能性就越大。因此,当进行初步筛选以基于二元数据(即存在/不存在)选择标志物时,遗传标志物的敏感性可用于预测目标宿主的定量表现。
宿主肠道中目标微生物的种群分布是遗传标记中考虑的另一个因素,也可能与标记敏感性和目标样品中的浓度有关。在本研究中,与其它细菌和病毒标志物相比,Bacteroidales标志物通常表现出更高的敏感性和浓度。这可能是因为与大多数其它微生物相比,Bacteroidales是哺乳动物肠道中的主要微生物种群。在我们的研究中,与猪相关的线粒体DNA(mtDNA)标记P.ND5也表现出很高的敏感性。这与关于mtDNA标记物丰富的早期研究一致,这表明脱落的上皮细胞中含有mtDNA的多个拷贝。因此,这些mtDNA可以提供与细菌16S rRNA基因相匹配的阳性信号。
我们还发现,与人类相关的Bacteroidales标记物比非人类相关的Bacteroidales标记物具有更低的灵敏度和浓度。此外,目标样品中与人类相关的Bacteroidales标记物表现出相对较宽的浓度分布。据我们所知,尽管迄今为止尚未对大多数Bacteroidales标记的广泛分布和稳定性进行过系统的调查,但我们的部分结果与先前的研究一致,该研究报道,BacCow比BacH具有更广泛的靶标宿主分布和更大的稳定性。与其他哺乳动物相比,这可归因于人类肠道中的优势细菌较少且可变性高。先前的研究表明,猪和牛粪便中的目标Bacteroidales比人类相关的Bacteroidales的相对丰度更高,更稳定。总体而言,数据表明目标微生物种群的分布对敏感性表现和遗传标记物浓度具有重大影响。
先前的一项研究报告说,人类粪便中发现了高度丰富的噬菌体“crAssphage”,然而,与其它评估标记相比,目标样品中CPQ_056和CPQ_064 crAssphage标记物的敏感性和浓度相对较低。一项研究还发现粪便样本中CPQ_056和CPQ_064的敏感性较低(均为46.1%)。这可能是由于人类粪便中的噬菌体分布不均造成的。先前的研究表明,宿主的年龄,健康状况或其他因素可能会影响粪便中噬菌体的分散或聚集,从而影响它们的检测。但是,由于该实验未考虑供体的年龄信息,且患者缺乏粪便样本,因此在未来的研究中进一步证实CPQ_056和CPQ_064敏感性低的原因。此外,中国人,欧洲人和美国人之间的卵子噬菌体丰度差异也可能是本研究中CPQ_056和CPQ_064敏感性较低的原因。研究报告称,在对86个可公开获得的基因组进行的调查中,与美国和欧洲相比,亚洲的污水中甲壳虫的数量较少。
3. 交叉反应
非目标样品发生交叉反应会导致标记物特异性差。迄今为止尚无具有绝对宿主特异性的遗传标记。交叉反应的机制尚不清楚,需要进一步研究。宿主相关遗传标记的某些基因组区域可能与不同动物之间的微生物同源。在我们的研究中,在城市化区域中人与宠物之间的频繁接触导致来自与人相关的标记中的宠物的假阳性信号比例更高。在其他亚洲地区也发现了类似的观察结果。例如,一项先前的研究报告说,在新加坡,非兔样品中的兔子与人类相关标记物有很大比例的交叉反应,这是由于它们被广泛用作该地区的普通物种。此外,在农村地区,自由漫游的家禽和宠物(尤其是狗)彼此之间没有隔离,这也可能解释了宠物与家禽相关的GFD标记物有很大比例的交叉反应。但是,由于我们没有从与人类和家禽(例如野兔)存在栖息地隔离的类宠物中收集粪便样本,因此在以后的研究中,需要通过使用来自不同栖息地的动物来进一步确认共同居住的影响。除了共同居住因素外,饮食和生理也可能解释交叉反应。例如,在我们的研究中观察到,与反刍动物相关的标记中来自非常见动物的交叉反应比例很高,这可能归因于这些动物的饮食和生理相似。
尽管有上述观察结果,但大多数遗传标记与非靶标样品的交叉反应性受限。如果同时使用两个或多个标记,这可能有助于正确识别污染源。这强调了表征每种标记物的物种交叉反应性的重要性,以有效地将它们结合起来以优化目标识别。例如,基于我们的结果,如果同时使用Hum2和CPQ_056人类相关标记,则在跟踪水体中粪便污染的来源时,可能会识别出由于驴中Hum2的存在而导致的潜在假阳性信号。同样,Hum2也可用于解决与鸭和狗有关的假阳性结果,该结果源自CPQ_056标记。
4. 低水平的假阳性信号
物种在不同位置对遗传标记物的交叉反应不一致,对MST分析的应用是一个重大挑战。例如,Hum2先前被确定可与美国某些地区的鸡肉,绵羊,牛和鹅发生交叉反应。尽管我们在猪,驴和兔子中发现了交叉反应性,但在我们的研究中并未用这些粪便样本进行扩增。这种交叉反应的地理变异性表明,如果在不同的地方或地区进行测试,标记可能只对某些动物产生阴性结果。但是,我们的研究表明,非目标宿主中的大多数假阳性信号均显着低于目标宿主,该观察结果可为排除交叉反应性提供有益的帮助。这与几项较早的研究一致,后者报道目标源中标记物的平均浓度通常比非目标源中的标记物浓度高1-5个数量级。由于稀释因子和通过水样中样品浓度和DNA提取造成的基因拷贝损失,这些非靶标宿主的如此低的水平可能不会显着干扰结果。此外,我们观察到大多数高度敏感的标记物,例如Pig-1-Bac,Pig-2-Bac和反刍动物相关标记物,在真阳性和假阳性信号之间呈现较大的差距。这些标记物的目标样品中的平均浓度比非目标样品中的平均浓度高3-4个数量级。这也可能提供更多可能性,以检测潜在的粪便污染源,同时消除错误的阳性信号。
应该注意的是,尽管大多数假阳性信号都比真阳性信号要低得多,但是仍然有个别的交叉反应物种更有可能出现假阳性信号并影响MST结果。例如,在我们的研究中,兔子和驴分别与人和反刍动物相关的标记物表现出高度的交叉反应性。这些假阳性信号可能会混淆真阳性信号的检测。因此,如果怀疑水样品中存在假阳性信号,则应优先考虑对已知发生交叉反应的物种进行更严格的审查,否则应从研究中排除,而采用其它标记。
5.分类对宿主特异性的应用
尽管非目标样品中标志物的平均浓度低于目标样品中的标志物浓度,但很难预测交叉反应动物产生的较低的假阳性信号。我们提出了一种基于25/75度量标准来解决此问题的新颖方法。如果目标样品的第25个百分位数浓度与非目标样品的第75个百分位数浓度不重叠,则标记通常会在正阳性信号和假阳性信号之间呈现最清晰的分布差距。非目标样本部分正信号可能会进一步降低假阳性信号干扰结果解释的可能性。
我们的建议为决策者和管理者提供了根据特定要求选择合适的标记的机会。例如,在高度城市化的地区,可能没有来自畜牧业的大量粪便污染投入来证明其监测的合理性。相反,这里的主要污染源将是人类和宠物。根据我们的结果分类,使用人类特异性SYBR-HF183标记可以对人类起源的污染提供高度敏感性。此外,由于大多数非靶标动物的标记物在非靶标宿主中的水平较低,因此可以掩盖来自大多数非靶标动物的交叉反应。此外,将Hum2和CPQ_064标记配对可以准确排除猫(MCR)的干扰,因为在这些动物中没有假阳性信号。此外,Pig-2-Bac或BacCow也可用于排除兔的交叉反应(SCR)。
重要的是,要获得可靠的第25/75指标以及目标和非目标样品中的平均浓度,需要来自各种动物的样品进行验证。USEPA MST指南建议应使用10种以上的动物来评估宿主特异性,这将使我们的研究处于可接受的范围内。但是,由于标记物在不同地理位置的可变性,在区域范围以外测试宿主特异性时,应增加非目标宿主物种的数量和样本量。另外,当跟踪环境水中的粪便污染源时,真阳性信号的水平可能会严重掩盖来自WCR的假阳性信号。如果水样品中出现高浓度的标记物,则来自WCR的潜在假阳性信号也可能会增加,并干扰MST结果。因此,应稀释水样品中的高浓度标记物,以确保无法检测到来自WCR的较低的假阳性信号。
这项研究基于对MST的定性和定量测试,验证了一系列宿主相关遗传标记的性能,并提出了一种新颖的分类方法,可全面表征标记的特异性。我们的发现为决策者和管理者提供了获得关键背景信息的机会,从而可以选择合适的标记物来应对以定量方式准确跟踪粪便污染源的挑战。在我们的预筛选实验中,只有一个家禽标志物(GFD)在中国具有适用性,并且单个标志物难以验证MST结果的准确性。开发用于特异性检测家禽粪便污染的可靠遗传标记的能力仍然是世界范围的挑战。这可能是由于与哺乳动物相比,家禽中肠道微生物的分布不同。Bacteroides及其相关生物通常用于开发与宿主相关的遗传标记,研究表明,在家禽肠道或粪便中并不经常检测到Bacteroides。因此,进一步的研究需要专注于开发可靠的方法来进行家禽相关源跟踪。此外,各种遗传标记的持久性也可能影响MST结果。最近的研究建立了淡水和海水中HF183和CPQ_056随温度变化的衰减模型。结果表明,HF183的衰减速率明显快于CPQ_056。这种差异可能会影响HF183与CPQ_056的耦合,从而确定来自非目标宿主的交叉反应性。因此,鉴定合适标记的衰减率对于MST验证同样重要。
你可能还喜欢