科研 | 全谱致病菌临床诊断新方法,测序深度提升1000倍
本文由李苗苗编译,董小橙、江舜尧编辑。
原创微文,欢迎转发转载。
我们在此报告了一个平台,其可以提高高通量测序的敏感性,用于检测和表征细菌、毒力决定因子和抗菌耐药性(AMR)基因。该系统使用由基于病理系统资源整合中心(PATRIC)数据库、综合抗生素抗性数据库(CARD)和毒力因子数据库(VFDB)的420万个寡核苷酸组成的探针组,分别代表包括所有已知人类致病菌的307种细菌物种、已知抗菌抗性基因和已知毒力因子。细菌捕获测序(Bac-CapSeq)的使用导致血液样本中细菌读数增加了1,000倍,并且与传统的无偏高通量测序相比,检测限降低了1到2个数量级,降至与药剂特异性实时PCR相当的水平,每个样品产生的总读数少至500万。它不仅检测到AMR基因的存在,还检测到AMR的生物标志物,包括组成型和差异表达的转录物。BacCapSeq是一种鉴别诊断细菌感染和定义抗菌敏感性的方法,可以降低发病率和死亡率、医疗保健成本以及抗生素的使用不当,从而有助于抗菌耐药性的发展。
论文ID
原名:BacCapSeq: a Platform for Diagnosis and Characterization of Bacterial Infections
译名:BacCapSeq:细菌感染的诊断和表征平台
期刊:mBio
IF:6.875
发表时间:2018.9
通信作者:W. Ian Lipkin
通信作者单位:美国纽约哥伦比亚大学感染与免疫中心
实验设计
实验设计流程图
实验方法
TaqMan实时定量PCR试剂标准
使用Geneious v10.2.3(https://www.geneious.com)(表S3),在所研究的细菌菌种的保守单拷贝基因中选择用于定量PCR(qPCR)的引物和探针。通过将跨越引物的靶基因片段克隆到pGEM-T Easy载体中来产生定量标准。使用Mini Plasmid Prep试剂盒纯化重组质粒DNA。使用NanoDrop One测定线性化的质粒DNA浓度,并通过用1 ng / ml鲑鱼精子DNA在Tris-HCl(pH8)中稀释来调节拷贝数。
探针设计
我们的目标是针对所有已知的人类细菌病原体以及任何已知的抗菌抗性基因和毒力因子。从PATRIC数据库中的可用细菌基因组中选择已知的人类致病细菌(11)。包括至少一种菌株或分离物被注释为“人类相关”和“致病性”的所有物种。由于探针数限制,每个物种选择一个基因组。在与该领域的专家协商后,我们添加了其他被认为具有致病潜力的细菌。最后的清单包含307种(表S1),包括比尔和梅林达盖茨基金会儿童健康和死亡预防计划清单中优先列出的19种细菌。
提取来自307种选定基因组的蛋白质编码序列,并与CARD数据库中的2,169种抗菌抗性基因序列的完整数据集(12)和VFDB数据库中的30,178种毒力因子基因组合(13,14)。所有数据库均于2017年3月下载。组合的靶序列数据集(1,196,156个基因)以96%的序列同一性聚类(产生1,007,426个基因)并送至Roche Sequencing Solutions的生物信息学中心,其中序列为印刷考虑进行进一步的过滤。通过调整它们的起始/停止位置以限制熔化温度来重新确定探针长度。最终文库包含4,220,566个寡核苷酸,平均长度为75个核苷酸。相对于目标细菌蛋白质组,毒力和AMR目标的探针之间的平均相互作用距离为121 nt。
无偏高通量测序
将双链DNA(用于检测细菌)或cDNA(用于检测转录物)剪切至平均片段大小为200 bp(E210聚焦的超声波仪)。使用AxyPrep Mag PCR净化珠纯化剪切产物,并使用KAPA文库制备试剂盒构建文库,输入量为10至100 ng DNA。文库被纯化,由Bioanalyzer定量,然后分裂,一半由BacCapSeq处理(见下文),另一半在Illumina MiSeq平台v3上直接测序,具有150个循环(San Diego,CA))。
细菌捕获测序
除了使用SeqCap EZ索引的衔接子试剂盒之外,核酸制备、剪切和文库构建与UHTS相同。使用Bioanalyzer检查文库的质量和数量。将文库与SeqCap HE通用寡核苷酸、SeqCap HE索引阻断寡核苷酸和COT DNA混合,并在60 ℃下真空蒸发。将干燥的样品与杂交缓冲液和杂交组分A混合,然后在95 ℃变性10分钟。加入BacCapSeq探针文库并在标准PCR热循环仪中于47 ℃杂交12小时。将SeqCap Pure捕获珠洗涤两次,与杂交混合物混合,并在47 ℃保持45分钟,每10至15分钟涡旋10秒。捕获与生物素化的BacCapSeq探针复合的链霉抗生物素蛋白捕获珠在47 ℃洗涤一次,然后在室温下用洗涤缓冲液洗涤两次,这增加了严格性。最后,将珠子悬浮在50 μl水中并直接进行后杂交PCR。在Illumina MiSeq平台v3上测序之前,纯化PCR产物。提取、文库构建、杂交、产生150 bp单读数和生物信息学分析所需的时间约为70小时。
数据分析与生物信息学途径
每个样品平均产生500万个100 bp的单端读数。使用Cutadapt v1.13对解复用的FastQ文件进行适配器修整(29)。适配器修整后,使用FastQC v0.11.5(https:// www .bioinformatics.babraham.ac.uk / projects / fastqc /)生成质量报告,并使用PRINSEQ v 0.20.3进行过滤(30)。通过使用Bowtie2 v2.0.6将过滤的读数与人类基因组作图来确定宿主背景水平(31)。使用Megahit v1.0.4-beta从头组装减去宿主的读数(32);使用MegaBlast对GenBank核苷酸数据库对重叠群和独特单体进行同源性搜索(33)。使用过滤数据集将测试细菌的基因组用Bowtie2作图,以显示IGV中的深度和基因组恢复(34,35)。尖峰实验的结果没有任何结尾。临床血培养和AMR治疗分析的结果使用经验结尾值表示。读数高于0.001%结尾值(10读数/ 100万质量和宿主过滤读数)的目标被评为阳性。
仅美国就有超过150万人每年发生败血症; 大约250,000人丧命(1)。目前对败血症的诊断是基于培养,可能需要48至72小时(2,3)。另一个挑战是一些致病细菌是苛刻的,例如军团菌Legionella或巴尔通体菌Bartonella,难以培养。已经建立了多重PCR系统用于鉴别诊断多达19种致病菌的感染(4)。然而,目前还没有任何平台可以快速、同时地了解系统发育、致病性标记和抗菌耐药性(AMR),以便能够进行早期和精确的抗生素治疗,从而降低发病率、死亡率和经济负担。
靶向序列捕获的策略已被用于评估人外显子组和个体靶向基因以及用于病毒发现(5-7),监测和诊断(8,9)。在此,我们描述了一种细菌捕获序列系统BacCapSeq,以VirCapSeq-VERT为模型,这是一种类似的系统,用于检测感染脊椎动物的所有已知病毒(10)。
实验结果
探针设计策略
我们基于病理系统资源整合中心(PATRIC)数据库组装了包含420万个寡核苷酸的探针组,代表包括所有已知人类致病菌的307种细菌物种(11)。探针组还代表所有已知的抗菌抗性基因和毒力因子,其基于综合抗抗生素数据库(CARD)(12)和毒力因子数据库(VFDB)中的序列(13,14)。沿307靶向细菌的编码序列(参见补充材料中的表S1)选择探针,平均长度为75个核苷酸(nt),以保持探针解链温度(Tm)平均值为79℃。沿着用于捕获的注释蛋白质编码序列的探针之间的平均间隔为121 nt(更多细节参见材料和方法)。探针捕获包含与其靶标相邻的序列的片段;因此,我们恢复了接近完整的蛋白质编码序列。肺炎克雷伯菌的一个例子如图1a所示。基于CARD和VFDB数据库的探针确保了AMR基因和毒力因子的覆盖,如通过检测霍乱弧菌中的toxR毒力因子调节剂(图1b)和肺炎克雷伯菌中的blaKPC AMR基因(图1c)所示。
图1 与无偏高通量测序相比,BacCapSeq产生更多的读数和更高的基因组覆盖率
使用掺有细菌核酸的全血核酸的BacCapSeq表现
细菌捕获序列(BacCapSeq)系统与常规无偏高通量测序(UHTS)的效率在每个样品5百万个读数获得的数据的并列比较中进行评估。我们开始用来自百日咳博德特氏菌Bordetella pertussis、大肠杆菌Escherichia coli、脑膜炎奈瑟菌Neisseria meningitidis、肠炎沙门氏菌血清型伤寒沙门氏菌Salmonella enterica serovar Typhi、无乳链球菌Streptococcus agalactiae、肺炎链球菌Streptococcus pneumoniae、霍乱弧菌V. cholerae和空肠弯曲菌Campylobacter jejuni的DNA全血提取物,浓度范围为40至40,000 copies/ml。与UHTS相比,BacCapSeq对所有测试的细菌靶标产生高达100倍的读数和更高的基因组覆盖率(表1)。BacCapSeq的增强性能在较低的拷贝数下尤其明显。
表1 与加入细菌DNA的全血提取物相比,BacCapSeq产生的读数和基因组覆盖率高于UHTS
使用全血加入细菌细胞的BacCapSeq表现
我们用掺有肺炎克雷伯菌、百日咳博德特氏菌、脑膜炎奈瑟氏球菌、肺炎链球菌和结核分枝杆菌细胞的全血测试了表现。从加标样品中提取核酸并加工成BacCapSeq或UHTS。在此,BacCapSeq比UHTS产生更多的读数和更高的基因组覆盖率(表2和图2)。
表2 与掺有细菌细胞的全血相比,BacCapSeq产生的读数和基因组覆盖率高于UHTS
图2 带有细菌细胞的血液的细菌读数。
使用培养的血液样本的BacCapSeq表现
在分析从纽约长老会医院/哥伦比亚大学医学中心的临床微生物学实验室获得的血液培养样品中,我们测试了BacCapSeq效用。将患者血液收集到常规BacTec血液培养物中并进行培养直至通过BD BacTec自动血液培养系统(Becton Dickinson)生长为阳性。使用BacCapSeq,我们恢复了接近全基因组序列并鉴定出与标准临床微生物学实验室抗菌敏感性测试(AST)配方相匹配的抗菌抗性基因(表3;参见补充材料中的表S2)。
表3 检测培养血液中的致病菌和抗菌基因
BacCapSeq与人体血液样本的表现
提取来自两名患有HIV / AIDS的免疫抑制个体和原因不明的败血症的血液样品,并同时进行BacCapSeq和UHTS分析。任何一种方法都可以识别出致病因子; 然而,BacCapSeq产生了更多的相关读数和更好的基因组覆盖率(图3)。在一名患者中检测到肠沙门氏菌。另一名患者有肺炎链球菌和阴道加德纳菌共感染的证据。
图3 鉴定两名免疫抑制的HIV / AIDS和不明原因脓毒症患者的细菌
BacCapSeq促进了潜在AMR生物标志物的发现
目前的探针组特异性地捕获CARD数据库中存在的所有AMR基因。证明AMR基因的存在并不等同于发现其功能表达的证据。为了应对这一挑战,我们开始使用BacCapSeq来寻找暴露于抗生素环境中的细菌的潜在的生物标志物。我们在存在或不存在抗生素的情况下,在1000 CFU / ml的接种物中培养对氨苄青霉素敏感和耐药的金黄色葡萄球菌菌株45,90和270分钟。然后我们提取RNA用于BacCapSeq和UHTS用于转录组学分析,以找到分化氨苄青霉素敏感和氨苄青霉素抗性的暴露于氨苄青霉素的金黄色葡萄球菌菌株的生物标记物。如图4所示,BacCapSeq能够发现在抗生素暴露的90分钟和270分钟之间差异表达的转录物。这些代表反映细菌复制的组成型基因,包括经典的菌株和物种特异性标记,如16S和23S rRNA,延伸因子Tu(tuf)和G(fusA),蛋白A(spa),聚集因子B(clfB),或30S核糖体蛋白S12(rpsL)。
图4 在氨苄青霉素存在下培养45,90和270分钟后,对金黄色葡萄球菌敏感(AMR-)或对氨苄青霉素具有抗性(AMR+)的七种转录物的水平。
讨 论
在抗生素前期,产褥期败血症是孕产妇死亡的常见原因。高达30%的儿童在出生后第一年无法存活,社区获得性肺炎和脑膜炎分别导致30%和70%的死亡率(15)。细菌诊断和抗生素的出现不仅减轻了自然发生的传染病的负担,而且通过实现器官移植、关节置换和其他侵入性外科手术、免疫抑制化疗和烧伤管理等临床医学的创新(16),也提高了我们的生活质量。AMR的出现威胁着这些进步。2013年,由于医院获得性感染,世界经济合作论坛估计仅在美国每年就有10万例与AMR有关的死亡(17)。AMR的全球影响估计每年有700,000人死亡,发展中国家的负担最高。财务影响也很可怕。疾病预防控制中心估计,美国抗生素耐药性的直接年度影响为20至350亿美元(USD),另外还有350亿美元的生产力损失(18)。如果没有有效的应对措施来限制AMR的进一步增长,那么挑战将继续增加。世界银行于2017年3月发布报告称,到2030年AMR对国内生产总值(GDP)的影响将在1.1万亿至3.4万亿美元之间(19)。
早期,准确的细菌感染鉴别诊断对于降低发病率、死亡率和医疗保健成本至关重要。它还可以通过减少抗生素的使用不当来增强抗生素管理。常用于细菌感染鉴别诊断的多重PCR方法可以鉴定潜在的病原体,但不能提供对AMR基因的存在或表达的见解。此外,它们不包括很少与重要疾病相关的细菌,如阴道加德纳菌,这与艾滋病毒/艾滋病患者的原因不明的脓毒症有关。基于培养的方法需要2到几天的时间来识别病原体,甚至更长时间才能提供抗生素敏感性(20,21)。因此,医生通常在获得更多特定信息之前管理广谱抗生素(22)。
我们尚未对BacCapSeq进行严格的验证,使用的方法可以确定临床微生物学中批准诊断分析所需的检测限和重现性。尽管如此,加入已知浓度的细菌DNA(表1和图1)或细菌细胞(表2和图2)的血液样本获得的结果显示,使用BacCapSeq与UHTS获得的回收的读数和基因组覆盖率呈剂量依赖性、一致性增强。在细菌载量低至每毫升40个细胞的情况下,UHTS未检测到结核分枝杆菌、肺炎克雷伯菌、脑膜炎奈瑟球菌或肺炎链球菌的序列,并且仅检测到百日咳博德特氏菌的一个序列。在每一个这些情况中,BacCapSeq检测到多个读数(结核分枝杆菌,6;肺炎克雷伯菌,522;脑膜炎奈瑟氏球菌,151;肺炎链球菌,4;百日咳博德特氏菌,269)(表2)。在不明原因脓毒症患者的血液分析中也观察到了这一优势(图3),其中用BacCapSeq获得的读数高于UHTS对于肠道沙门氏菌(3,183对132),肺炎链球菌(419,070对130)和G阴道炎(776,113对2,080)。这些发现表明,当血液中的细菌水平低于每毫升40个细胞时,BacCapSeq有可能表明UHTS可能遗漏的病原体存在。
血培养系统中的孵育期通常为3天至5天(23-25)。对于一些致病物种的奈瑟氏球菌、立克次氏体、分枝杆菌、钩端螺旋体、埃里希氏体、柯克斯拉菌、樟子松、伯克霍尔德氏菌、布鲁氏菌、博德特氏菌和巴尔通体的敏感检测可能需要更长的间隔。另一个挑战是细菌负荷可能很低或是间歇性的。Cockerill等(24)和李等人(26)已经提出,在检测活细菌的99%测试灵敏度中,需要在四个独立的至少20 ml血液的集合中的80 ml血液。我们没有对BacCapSeq或UHTS与培养物进行头对头比较。我们也无法解决间歇性菌血症的问题,但是目前对BacCapSeq灵敏度的估计(每毫升至少40个拷贝)与培养试验中推荐的80 ml样品量相当(26)。美国微生物学会和临床与实验室标准协会(CLSI)要求假阳性率低于3%(27,28)。BacCapSeq诊断微生物学卫生协议比培养更严格,因为常见的消毒剂不会消除核酸。为了限制基于伪读取信号的潜在误报电话,我们提出了保守的阈值截止,用于每百万次读取10次读取的博纳德信号。然而,特定菌株或分离物的特定读数的存在应该触发使用替代方法搜索确认或反驳,例如基于BacCapSeq或UHTS的发现的特异性PCR测定。
BacCapSeq旨在检测CARD数据库中的所有AMR基因。当这些基因位于细菌染色体上时,我们预计侧翼序列将允许与样品中的特定细菌结合,即使这些样品含有多于一种细菌物种。如果AMR基因是染色体外的,我们可能无法这样做。然而,预计BacCapSeq能够发现组成型表达和诱导的转录物,这些转录物反映了功能性细菌特异性AMR元件的存在。
我们建立BacCapSeq的目的是为了能够有效和灵敏地检测致病菌、毒力因子和抗菌素耐药基因。与VirCapSeq-VERT(用于病毒诊断和监测的类似序列捕获平台)一样,预计BacCapSeq可以对测序能力进行集中投资。这应该有助于多重化和降低测序成本以及生物信息学分析的复杂性。
评 论
BacCapSeq平台综合多个权威大型致病、抗药等数据库,可以快速、同时地了解系统发育、致病性标记和抗菌耐药性(AMR),降低发病率、死亡率和经济负担。我们组也在预测及分析细菌致病及耐药等指标,可是我们需要大量的时间对我们的细菌进行预测分析,BacCapSeq平台快速实现了这些功能,可节约大量时间。
想加入我们微生态学术群吗?可以长按或扫描以下二维码,审核通过后我们邀请您加入。这些微信群旨在为微生态研究者提供交流平台,而且我们会通过网络举办一系列的微生态研究技术讲座,分享一系列相关研究文献,举办一系列交流研究成果的学术活动。
了解更多菌群知识可以长按或扫描以下二维码关注“微生太”。
👇
详情点击下面👇链接进行查看
500元教你深度挖掘常用数据库TCGA、GEO及SRA,还有机会免费参加!(11月3-4日)
参考文献
7. Hodges E, Xuan Z, Balija V, Kramer M, Molla MN, Smith SW, Middle CM, Rodesch MJ, Albert TJ, Hannon GJ, McCombie WR. 2007. Genome-wide in situ exon capture for selective resequencing. Nat Genet 39:1522.https://doi.org/10.1038/ng.2007.42
8. Williams SH, Cordey S, Bhuva N, Laubscher F, Hartley M-A, Boillat-Blanco N, Mbarack Z, Samaka J, Mlaganile T, Jain K, d’Acremont V, Kaiser L, Lipkin WI. 2018. Investigation of the plasma virome from cases of unexplained febrile illness in Tanzania from 2013 to 2014: a comparative analysis between unbiased and VirCapSeq-VERT high-throughput sequencing approaches. mSphere 3:e00311-18. https://doi.org/10.1128/mSphere.00311-18.
9. Cummings MJ, Tokarz R, Bakamutumaho B, Kayiwa J, Byaruhanga T, Owor N, Namagambo B, Wolf A, Mathema B, Lutwama JJ. 2018. Precision surveillance for viral respiratory pathogens: virome capture sequencing for the detection and genomic characterization of severe acute respiratory infection in Uganda. Clin Infect Dis
11. Wattam AR, Davis JJ, Assaf R, Boisvert S, Brettin T, Bun C, Conrad N, Dietrich EM, Disz T, Gabbard JL, Gerdes S, Henry CS, Kenyon RW, Machi D, Mao C, Nordberg EK, Olsen GJ, Murphy-Olson DE, Olson R, Overbeek R, Parrello B, Pusch GD, Shukla M, Vonstein V, Warren A, Xia F, Yoo H, Stevens RL. 2017. Improvements to PATRIC, the all-bacterial bioinformatics database and analysis resource center. Nucleic Acids Res 45: D535–D542. https://doi.org/10.1093/nar/gkw1017.
12. Jia B, Raphenya AR, Alcock B, Waglechner N, Guo P, Tsang KK, Lago BA, Dave BM, Pereira S, Sharma AN. 2016. CARD 2017: expansion and model-centric curation of the comprehensive antibiotic resistance database. Nucleic Acids Res 45:D566–D573.
13. Chen L, Zheng D, Liu B, Yang J, Jin Q. 2016. VFDB 2016: hierarchical and refined dataset for big data analysis—10 years on. Nucleic Acids Res 44:D694–D697. https://doi.org/10.1093/nar/gkv1239.
32. Li D, Liu C-M, Luo R, Sadakane K, Lam T-W. 2015. MEGAHIT: an ultra-fast single-node solution for large and complex metagenomics assembly via succinct de Bruijn graph. Bioinformatics 31:1674 –1676. https://doi.org/
10.1093/bioinformatics/btv033.
35. Thorvaldsdóttir H, Robinson JT, Mesirov JP. 2013. Integrative Genomics Viewer (IGV): high-performance genomics data visualization and exploration. Brief Bioinform 14:178 –192. https://doi.org/10.1093/bib/bbs017.