科研 | Trends Microbiol.:人类一直在寻找的基因——宿主抗性基因

编译:秋秋糖,编辑:小白、江舜尧。

原创微文,欢迎转发转载。

导读

随着抗生素耐药性的发展、新的疫情爆发及已被消灭的传染病再次出现,因感染病原微生物而死亡的人数不断增加,不仅造成严重的公共卫生问题,还造成巨大的经济损失。因此,宿主与微生物之间相互作用的机制研究迫在眉睫。目前,基因组学的进步正在推动微生物领域的重大突破,在这篇综述中,作者重点介绍了前沿遗传学和基因组学应用于识别宿主感染细菌后其抵抗力的遗传决定因素的筛查,讨论了如何利用CRISPR/Cas9、自然多样性、蛋白质组学和转录组学等手段来筛选宿主抗性基因,并且总结了这些筛选方法的优点、局限性和创新性与互补性,以便人类继续在后基因组时代取得进展,并朝着更深层次的机制研究和临床应用迈进。

论文ID

原名:These Are the Genes You’re Looking For: Finding Host Resistance Genes
译名:人类一直在寻找的基因——宿主抗性基因
期刊:Trends in Microbiology
IF:13.546
发表时间:2020.09
通讯作者:Dennis C. Ko
通讯作者单位:杜伦大学

内容

1. 关键学科的新兴研究工具

17世纪中期,胡克和范·列文虎克第一次使用显微镜观察到微生物,随后巴斯德、亨勒、科赫和其他人进一步深入微生物研究,分子生物学的出现则彻底改变了微生物的研究方式,而基因组学的进步推动微生物学研究的重大突破。微生物学领域也不断开发新的遗传工具进行遗传学研究,如成簇的规则间隔的短回文重复序列和CRISPR相关蛋白9(CRISPR/Cas9)。这种新技术的出现对微生物研究产生了重要影响。

在这篇综述中,作者主要介绍了前沿遗传学和基因组学筛选如何被应用于识别宿主对细菌感染的抵抗力的研究中。讨论了利用CRISPR/CAS9、自然多样性、蛋白质组学和转录组学来进行抗性基因的筛选,这些方法在宿主-细菌相互作用研究的创新中起到了推动性力量。

2. 利用CRISPR/Cas9鉴定宿主抗性基因

基因筛查从根本上提高了我们对生物学的理解,直到最近,这些研究还仅限于哺乳动物细胞系。抗性基因的筛查主要为siRNA敲除系统,但由于其可能存在脱靶效应以及其吞吐能力有限,在临床性状的相关研究中具有一定的局限性。通过克服这些问题,CRISPR基因敲除筛查方法已经成为近年来鉴定宿主基因和宿主对细菌感染反应途径的主要方法。CRISPR筛选有两种形式,传统的阵列筛选和混合筛选,绝大多数宿主-病原体相互作用的CRISPR筛选都采用后者。混合筛选法首先将单链向导RNA(sgRNA)池传递到表达Cas9的细胞群体中,然后基于细胞表型进行筛选,最后通过测序比较每个sgRNA在选择的和未选择的样本中的频率(图1)。与siRNA筛选或阵列CRISPR筛选相比,通过筛选池中的多个引导物并将多个sgRNA定向到单个基因,这种池方法减少了脱靶效应、批量效应或失败敲除带来的噪声。此外,由于CRISPR/CAS9技术正迅速适用于各种物种的许多原代和永生化细胞系,该筛选平台可用于检测依赖于细胞类型和细胞系的耐药性或敏感性因素。CRISPR筛查也可以在体内进行,因为多项研究已经敲除了小鼠免疫祖细胞中的基因,将它们输送回受辐射的小鼠,并测量了对免疫细胞发育的影响。

虽然基因敲除系统是强大的工具,但也具有一定的局限性。例如,基因敲除可能会对掩盖表型的遗传全景产生意想不到的后果。由CRISPR/Cas9引起的早期终止密码子可以通过与无意义介导的mRNA衰退配对的补偿过程上调相关基因。尽管如此,通过不断地改进CRISPR/Cas9的筛查,目前该方法已经探索了细菌感知、吞噬吸收、细菌对细胞内生态位的操纵以及毒素敏感性等诸多领域。

Parnas等进行了全基因组筛选(针对21786个小鼠基因的125793个sgRNAs)以解开髓系细胞对内毒素(LPS)刺激响应的机制。筛选鉴定了LPS信号转导的已知因子,包括TLR4、MYD88、ZFP36,以及肿瘤坏死因子(TNF)的新的正负调控因子。后续实验发现寡糖转移酶(OST)复合体调节Toll样受体(TLR)4信号转导途径。有趣的是,在小鼠PRO-B细胞系中的一个独立的CRISPR筛查也发现OST复合体调节TLR5,7和9信号,这表明精氨酸糖基化是TLR信号的一个保守的调节因子。一旦机体感受到PAMP,必须调节免疫反应,以避免过度炎症和/或脓毒症。几个研究小组试图通过CRISPR筛查来探究这一调节,其中一个小组确定了补体肽酶Cpb1是caspase11介导的对LPS、沙门氏菌和小鼠巨噬细胞中志贺氏菌反应的热下垂的积极调节因子。他们的实验验证表明,CPB1使C3/C3aR信号通路能够放大TLR4和干扰素-α/β受体(IFNAR)信号级联,增强caspase11的活性,并增强小鼠和人类的脓毒症严重程度。另外一系列CRISPR筛查显示,在小鼠模型中,自噬基因调节肿瘤坏死因子信号,以对抗干扰素-γ(IFN-γ)介导的细胞死亡和脓毒症。这些研究证明了CRISPR筛查在体外识别与有害免疫反应有关的基因的能力,这些基因在体内也可以作为脓毒症的生物标记物或可用药靶点。

此外,许多研究小组已经使用CRISPR/Cas9筛查来研究宿主基因如何促进细胞内细菌的生活方式,特别是在吞噬宿主细胞中。最近的研究筛查确定了肠道沙门氏菌摄取PMA分化的人THP-1巨噬细胞所需的宿主基因。该筛查使用磁性分选来确定分化的人类U937巨噬细胞摄取珠子或其他底物[红细胞(RBCs)、髓鞘、酵母多糖]与铁纳米颗粒结合所需的基因。还有研究对吞噬小体发育的后期进行筛查,发现吞噬细胞需要重碳酸盐转运蛋白SLC4A7来酸化它们的液泡并杀死细菌病原体。这些筛查总共发现了数十个与吞噬作用有关的基因。

虽然上面的研究集中在抵抗细菌感染所需的宿主基因上,但也有研究发现了细菌感染后促进发病的宿主蛋白。例如,一系列筛查确定了嗜肺性军团菌进入吞噬细胞、复制并最终杀死宿主细胞所需的数百个宿主因子。这项研究全面介绍了先前发现的宿主因子和新发现的基因是如何协同作用以促进发病的。更多的工作集中在启用细菌介导的细胞毒性的宿主因素上。例如,一个聚焦于副溶血性弧菌诱导的细胞死亡的CRISPR筛查发现,宿主细胞表面硫酸化允许细菌使用其III型分泌系统1粘附和杀死细胞,而宿主细胞表面岩藻糖基化使III型分泌系统2转位蛋白能够进入宿主膜并促进细胞毒性。对肠出血性大肠杆菌的类似研究表明,宿主鞘脂的生物合成对于III型分泌和志贺毒素介导的细胞死亡都是至关重要的。最后,陶等人的CRISPR筛查,发现Wnt受体Frizzled(FZD1/2/7)的某些家族成员是艰难梭菌毒素TcdB的主要结肠受体。这些研究突出了CRISPR对疾病风险位点的筛查识别,这些位点是宿主指导治疗以减少细菌诱导的病理的潜在靶点。

总之,这项工作证明了CRISPR筛查方法已经对了解宿主对细菌感染的抵抗力产生了影响,而这项技术也在不断优化。

如上所述,在活体内进行CRISPR筛查已经取得了重大进展。然而,在整个模式生物体中,使用随机诱变进行功能丧失的筛选仍然占主导地位(例如,n -乙基-n -亚硝基脲(ENU)诱变)。世卫组织使用ENU突变筛选来确定LTA4H在调节斑马鱼对海洋分枝杆菌感染的敏感性中的关键作用。有趣的是,他们发现Lta4h的活性平衡至关重要,因为过度的活动会导致促炎的LTB4二十烷类化合物的积累,而活性降低会导致抗炎脂素A4的积累。有研究证实了这一最佳免疫平衡,因为与LTA4H基因表达相关的人类SNPs具有杂合优势,LTA4H基因型似乎可以作为抗炎药物地塞米松疗效的预测生物标志物。斑马鱼与人类遗传学的结合,导致了临床转化,展示了随机突变筛选的力量。

图1 鉴定寄主抗性基因的筛选方法

图中上半部分:成簇的规则间隔短回文重复序列(CRISPR)/CRISPR相关蛋白9(Cas9)筛选通过将向导RNA(SgRNA)池转染细胞并对与宿主-细菌相互作用相关的特征进行选择,实现了高通量的基因筛选。在提供的例子中,不同的颜色代表转染了不同sgRNAs的细胞,绿色指南敲除了下睑下垂所需的基因。因此,在感染细菌后,向导DNA被富集,随后被鉴定。图中下半部分:自然遗传多样性筛选使研究人员能够识别对细菌感染具有抵抗力的基因位点。在确定了一个不同的群体和对细菌病原体的个体反应表型后,表型多样性可以在统计上与基因型多样性相关。在确定了与表型多样性相关的遗传位点(数量性状位点,QTL)之后,后续工作检查了哪些多态性和/或基因与寄主抗性有关。此外,单个研究的比较和整合到额外的筛选中可以提供QTL在寄主生物学中作用的更完整的图景。图中右侧部分:双重筛选包括同时筛选宿主和细菌基因组、转录组和蛋白质组。这些方法主要是研究宿主-细菌的联合相互作用,以了解细菌克服宿主以提高毒力。这些方法可以成为关键的假设生成工具。缩写:CXCL10;C-X-C基序趋化因子配体10;GWAS,全基因组关联研究。

CRISPR筛查的两个主要进展,(1)旨在调节基因表达而不是消除基因表达的Cas9;(2)敲除多个基因以了解遗传网络。

研究人员已经开发出不直接干扰基因的情况下增加(CRISPRa)或降低(CRISPRi)宿主基因表达的系统。与传统的cDNA过表达系统不同,CRISPRa在天然位点调节表达,从而保持顺式调控效应的完整性。虽然没有使用CRISPRa进行细菌宿主耐药性筛查,但最近的研究发现可以使用它来识别诺沃克病毒耐药性基因。

除了在调控表达方面的进展外,一些研究还试图研究在单个细胞中干扰多个基因如何影响宿主表型(图2)。使用标准CRISPR/CAS9、CRISPRa和CRISPRi技术的方法都试图将sgRNAs共转染到细胞中,确定哪些sgRNAs被表达,并测量这些共表达的sgRNAs对宿主的影响。有几种不同的方法来检查组合效应,主要不同的是如何确定哪些sgRNA被转染到细胞中。一种称为CRISP-Seq的技术是成对的CRISPR筛选、荧光分类和单细胞RNA测序。通过在sgRNA质粒上放置荧光标记,作者能够使用细胞分类和单细胞测序将每个细胞中表达的sgRNA与转录组中由此产生的变化联系起来。虽然CRISP-Seq有很大的前景,但测试的sgRNA组合的数量受到单细胞RNA测序吞吐量以及可用荧光标记数量的限制。另一种称为直接捕获扰动序列的方法,利用与改进的文库制备配对的单细胞RNA测序,在测序过程中直接鉴定表达的sgRNA。

图2 多基因成簇规则间隔短回文重复(CRISPR)基因敲除筛查方法

分析多基因缺失影响的两种方法包括CRISP-SEQ和DirectCapture Perturb-Seq。在CRISP-SEQ(图中上半部分)中,向导RNA(SgRNA)质粒包括唯一的荧光标记和唯一的引导指数(UGI),允许两种独特的方式来确定哪些sgRNA被转染到由单细胞RNA-SEQ检测的每个细胞中。首先,在文库生成期间,可以使用流式细胞术来确定哪些荧光标记在细胞中表达。其次,在RNA测序过程中可以直接检测到UGI,并将其映射回sgRNA质粒。综上所述,这些特征可以间接识别细胞中表达的sgRNA,以及由此导致的每个转录组的变化。相比之下,直接捕获perturb-seq(下)仅使用修改的单细胞RNA-seq文库制备,使sgRNA能够直接将每个表达的sgRNA与转录组一起测序。缩写:FACS,荧光激活细胞分选。

3. 利用自然遗传多样性鉴定寄主抗性基因

基因敲除系统的另一个限制是它们不能揭示哪些基因导致了“自然”的个体间差异。这是因为大多数个体间的差异主要是单核苷酸多态性。因此,利用自然多样性的互补技术对于识别自然产生的寄主抗性和易感基因是必要的。

利用自然变异来识别寄主抗性基因的技术和统计框架各不相同,但大致分为连锁分析和关联分析。多年来,连锁分析一直是研究孟德尔性状的主要方法,特别是在发现罕见的变异“先天免疫错误”方面,例如白细胞介素(IL)-12和干扰素-γ信号突变。然而,为了识别更多的多基因性状的常见抗性等位基因,全基因组关联研究(GWAS)是主要的发现方法。在GWAS中,对遗传多样性人群的成员进行表型评估(例如,感染状态、疾病严重程度、感染期间的细胞因子反应、白细胞计数等)。然后,测试整个基因组中的标记与性状的关联,询问每个标记在考虑遗传相关性和其他协变量(通常通过主成分分析)时,每个标记解释观察到的表型变异的程度如何。这些研究依赖于连锁不平衡图,这些连锁不平衡图用于选择标签SNPs(以减少需要基因型的标记的数量),并使用染色体上的遗传模式来理解个体关联信号。这些技术已经确定了与遗传抗性、敏感性和定量宿主-细菌相互作用相关的位点[数量性状位点(QTL)]。作者讨论了自然变异在宿主-细菌研究中的三个应用:(1)通过关联作图利用模式生物中的自然变异,(2)利用GWAS利用人类的自然遗传变异,以及(3)使用细胞GWAS在体外检测自然遗传变异。

4. 利用自然多样性在小鼠模型中鉴定宿主细菌抗性基因

许多研究已经将无脊椎动物和脊椎动物的感染模式与这些物种中存在的自然多样性进行配对,以研究宿主与病原体的相互作用。

在这里,主要专注于使用合作杂交(CC)小鼠模型的细菌系统的宿主遗传筛选,该模型由来自8个不同的创始菌株(C57BL6/J,129S1/SvlmJ,A/J,NOD/ShILtJ,Nzo/HiLtJ,CAST/EIJ,PWK/PhJ和WSB/EIJ)的约100个重组近交系组成。这些不同但近亲交配的菌株允许几乎相同的基因复制以及后续的实验跟踪。

几项研究已经确定CC小鼠对肺炎克雷伯氏菌、肠杆菌血清型鼠伤寒沙门氏菌(鼠伤寒沙门氏菌)、铜绿假单胞菌以及牙周炎相关细菌牙龈卟啉单胞菌和核梭杆菌的反应和敏感性的自然变化。即使在相对较小的队列中(35-48个CC株系),鼠伤寒沙门氏菌和肺炎克雷伯菌的研究也确定了潜在的易感性QTL。这篇综述的一位作者的另一项工作表明,CC小鼠在结核分枝杆菌感染后包含了广泛的表型谱,并进一步表明宿主遗传背景改变了卡介苗(Bacillus Calmette-Guérin)疫苗对结核病的保护效力。宿主对结核分枝杆菌的内在抵抗力和对卡介苗的应答不相关,表明结核分枝杆菌保护的遗传复杂性。

如上所述,CC的一个优点是能够通过机械实验跟踪表型。例如,在最初的结核分枝杆菌研究中,小鼠品系CC042对感染具有不寻常的敏感性。进一步的工作,使用F2代来定位QTL,发现CC042小鼠的Itgal基因有15个碱基的缺失,导致淋巴细胞运输受损和结核分枝杆菌易感性。另一个研究小组对CC042进行的研究发现,同样的缺失导致了对鼠伤寒沙门氏菌的易感性,突出了该蛋白在发病机制中的保守作用。CC042 Itgal缺失在原始CC亲本品系中缺失,而是在近亲交配过程中从头开始。近亲交配过程中这些从头突变的高频率可能会对CC世代的重复性产生影响。重要的是,这些研究表明,实验跟踪可以超越CC研究中获得的大量QTL,并揭示导致易感性差异的非常具体的遗传机制。

有两个研究将CC细菌发病机制研究与人类GWAS队列联系起来。第一个牙周模型研究,使用牙龈假单胞菌和核假单胞菌感染。不幸的是,即使是F2代,识别出的QTL也是巨大的--两个显著的QTL包含80个基因,而8个提示性的QTL包含1309个基因。因此,虽然作者注意到他们的QTL与侵袭性牙周炎和慢性牙周炎人类GWAS队列中识别的位点有一些重叠,但其含义尚不清楚。此外,Lorè等人使用CC系统检测了铜绿假单胞菌的敏感性,并确定了一个包含31个蛋白编码基因的QTL。通过检查他们的QTL和囊性纤维化GWAS中人类共线区域的SNPs之间的相关性,作者在DPYD中发现了两个SNPs,rs10875080和rs11582736,这两个SNPs与人类队列中首次感染铜绿假单胞菌的年龄适度延迟有关。后续工作尚未将DPYD与CC线路中的电阻连接起来。总而言之,这些数据既证明了CC小鼠识别可能的人类抗性基因的前景。

使用动物模型秀丽线虫和黑腹果蝇的自然多样性筛选十分常见,目的是了解宿主-病原体之间的相互作用,因为研究人员已经收集了这些物种的野生分离株,并进行了表型和序列测定。一个比较经典的例子是利用自然多样性来确定线虫神经肽Y受体同源物(NPR-1)中的单个氨基酸替代在野生分离株中驱动对细菌猎物的不同反应。最近的工作是试图了解这些食微生物性蠕虫是如何“避免”野外暴露病原体的。一个小组利用多样性小组鉴定了神经元泛素E3连接酶(HECW-1)中影响铜绿假单胞菌的单一氨基酸替换。随后利用多样性筛选来确定铜绿假单胞菌和粘质沙雷氏菌的QTL。

早期的工作利用果蝇的多样性来研究细菌的敏感性。在这些研究之后,一个包含数百个基因型菌株的图谱被设计出来,用于全基因组黑腹果蝇关联图谱的绘制:果蝇黑腹果蝇遗传参考板(DGRP)。使用该小组的一项研究发现,KRI、S6K、MAD2和BomBc1抗菌肽基因座的遗传变异与粪肠球菌耐药性相关。另一项研究通过将DGRP与嗜虫假单胞菌配对,扩展了我们对苍蝇肠道免疫防御的理解。研究人员发现,存活率较高的动物清除感染的速度更快,启动了更可控的活性氧物种反应,保持了蛋白质合成,并保持了肠道干细胞的活性。此外,还定位了27个存活QTL,其中包括NRK和Gyc76C基因上的几个SNP,作者证实这两个基因在免疫中起着关键作用。

通过使用标准化的DGRP,比较不同研究的结果变得更加容易。例如,一个令人印象深刻的筛选用金龟子绿僵菌或铜绿假单胞菌感染了DGRP,并确定了一些与生存相关的性别相关QTL,包括与粪肠球菌存活相关的kri、S6K、MAD2位点。此外,通过挖掘DGRP研究,他们发现,地理趋向性、氧化应激、血糖、饥饿和睡眠模式都与感染后的存活率相关。奇怪的是,尽管实验室斑马鱼品种有大量的遗传多样性,但我们不知道如何利用这种多样性来研究传染病的工作。这也是该领域未来的一个有意义的研究方向。

5. 利用自然人类多样性识别寄主抗性基因

人类传染病的GWAS提出了几项挑战。首先,即使有协变量(即,年龄、性别、合并症和主成分分析中的未知因素),成功的GWAS也需要大的人口规模,通常在数千人左右。其次,获得暴露的对照是具有挑战性的,因此许多传染病GWAS只是使用人群控制(例如,献血者库)。与在没有保护性记忆反应的情况下接触病原体并抵抗感染的相匹配对照组相比,这种方法的成本明显较低。第三,将单个GWAS进行整合是比较困难的,因为人群、样本量、疾病定义和研究设计的差异会严重影响重复性。尽管有这些挑战,GWAS还是可以有效应用于临床,提供可能的临床生物标记物。例如,丙型肝炎病毒(HCV)感染的早期GWAS有助于指导重组干扰素治疗的遗传生物标记物的开发。

研究人员利用来自电子病历的临床信息(例如,UK Biobank,Emerge Network)和自我报告(23andMe)收集了大量的基因型个体数据库,并在许多表型上同时进行GWAS,从而扩大了样本量。例如,23andMe的一项研究招募了超过20万名欧洲裔参与者来填写一份关于他们患常见传染病经历的调查。该小组确定了与17种不同传染病相关的59个全基因组显着SNPs。他们还发现了影响多种疾病的多效性SNPs。例如,TBX1中的rs1978060与扁桃体切除术、儿童耳部感染和鼓膜切开术有关,这表明该基因与细菌易感性有广泛的关系。此外,他们发现HLA-I类基因中的SNP倾向于与病毒疾病易感性相关,而细菌性疾病更有可能在HLA-II类基因中有显著的SNP,这与每种蛋白在免疫中的典型作用是一致的。值得注意的是,他们还发现了自身免疫相关基因之间的关联,突出了感染保护等位基因和炎症稳态等位基因之间的潜在权衡。

即使没有大规模的数据库,在过去的十年中也发表了数十篇细菌敏感性GWAS论文(表1)。GWAS的结果增强了我们对宿主-病原体生物学和/或基因组学的理解。

表1 细菌感染的人类全基因组关联研究

5.1 校验

GWAS最关键的问题之一是,识别出的SNP是否为抽样偏差的结果。验证snp的黄金标准是在额外的、不相关的组群中复制这种关联。与最初的GWAS不同,GWAS需要全基因组意义(传统上P<5×10-8)来克服大量的多重比较,有针对性的关联复制可能具有较弱的统计意义。

复制GWAS失败的原因有很多,例如23andMe研究复制了已知的与带状疱疹和扁桃体切除术的关联,但未能复制其他几个已报道的全基因组关联。这可能是由于人群或患者纳入标准的差异,以及假阳性造成的。群体差异尤其难以克服,因为等位基因频率和群体间连锁不平衡的差异可能导致复制群体中罕见的SNP的动力不足,甚至如果SNP不存在,就不可能进行复制。此外,复杂的基因×基因和基因×环境交互作用可能会阻止某些等位基因在某些群体中产生影响。或者,不同研究之间疾病定义的差异可能会对患者纳入产生重大影响,从而导致所测量的实际表型的深刻差异。确定复制失败是由于传染病研究的异质性还是假阳性可能是困难的,通过仔细考虑所讨论的特定队列之间的差异可以最充分地解决这一问题。

观察到的GWAS命中效应大小往往大于其真正的生物效应,可能在很大程度上导致复制失败。对Palmer和Pe'er试图复制的100篇数量性状GWAS论文的结果进行了分析,其中31%的论文在Bonferroni校正的P值阈值下重复,相比之下,根据发现队列中的效应大小预测的比例为75%。与所有科学一样,对GWAS发现的解释是一个持续的过程,随着复制、功能和临床随访研究的进行,这个发现将更加经得起时间的考验。

5.2 生物学视野

对于GWAS发现的机制基础的研究过程中,一些研究人员关注的是相关基因是如何影响感染的。通过敲低或敲除该基因,探究细胞或老鼠如何改变其对病原体的反应。其他研究集中在揭示:(1)众多连锁不平衡中的哪个遗传变异导致一个位点与病原菌抗性有关,以及(2)该变异是如何调节相关基因诱导抗性的(例如,编码突变、增强子突变、剪接变异等)。

Curtis等人确定了ASAP1是一种新的人类对结核分枝杆菌的耐药因子。在确认ASAP1中的几个SNP在其最初的GWAS(约11000名俄罗斯人)中被推定为命中后,该小组在另一个俄罗斯数据集以及之前发表的来自加纳和冈比亚的队列中验证了这些SNP。为了将这种变异与ASAP1功能联系起来,研究小组检查了宿主基因型和分枝杆菌感染如何影响免疫细胞的表达。他们发现rs4733781风险等位基因与树突状细胞中ASAP1在基线和感染后表达降低有关。最后,他们证明了患者来源的树突状细胞中ASAP1基因的敲除降低了树突状细胞基质的消化和运动能力。这些数据表明,ASAP1有助于激活适应性免疫系统,因为抑制会阻碍树突状细胞向淋巴组织的迁移。

相比之下,郑等人的工作举例说明了GWAS如何能够提供对遗传调控以及宿主-病原体相互作用的见解。在他们的工作中,他们进行了最初的GWAS(约2100名汉族人),随后进行了两项较小规模的复制研究,以确定两个与结核病相关的SNP。他们对位于TGM6内含子的rs6114027进行了追踪,发现该风险等位基因与患者免疫细胞中TGM6表达降低有关。基于荧光素酶分析,他们证明内含子风险等位基因相对于保护性等位基因抑制了表达。对患者和小鼠模型的进一步研究证实了TGM6在结核分枝杆菌耐药性中的重要性。总之,这些数据都确定了含有rs6114027的内含子在调节TGM6表达中的等位基因特异性和因果作用,并证明了该基因在结核分枝杆菌感染过程中的重要性。

6. 利用人类的自然多样性识别宿主的抗性基因

由于在人类中可以测量的表型存在一定的限制,所以关于SNP如何导致影响病理生理的特定分子和细胞变化的研究比较困难。有研究利用GWAS方法来识别在刺激或感染初级免疫细胞、分化诱导多能干细胞(IPSCs)或淋巴母细胞系(通过Epstein-Barr病毒感染在体外使人类B细胞永生化)之后改变宿主细胞-病原体相互作用的SNPs。这些系统的共同优势是:(1)所有细胞系的剂量和时间一致,(2)细菌遗传学和/或PAMP来源受到控制,(3)技术和生物复制的供体相同,以及(4)可检测的表型数量更多。总体而言,这些系统已经确定了过多的新的SNP和基因,它们有助于宿主对感染的抵抗力。

细胞GWAS有望揭示导致对致病刺激的不同转录反应的遗传因素。类似于识别与基因表达相关的QTL(EQTL)的研究,这些研究试图了解响应eQTL(ReQTL),或对刺激的响应出现的eQTL。例如,在干扰素-γ或脂多糖刺激的患者来源的单核细胞上,或者在脂多糖、流感病毒或干扰素-β刺激的患者来源的树突状细胞上的研究,揭示了一些重QTL。相似的研究发现IPSC来源的巨噬细胞在干扰素-γ或鼠沙门氏菌刺激后存在reQTL和响应染色质可及性QTL(Response CQTL)。这些研究发现在细菌性、炎症性和/或自身免疫性疾病GWAS中发现的reQTL和SNP之间存在重叠。最近的工作已经确定了与单核细胞刺激过程中miRNA调控相关的QTL。这些研究表明,理解响应QTL补充了传统GWAS的信息。

另一项工作研究了变异是如何影响宿主免疫反应的。具体地说,人类功能基因组计划已经确定了影响病原体感知和免疫细胞体外产生细胞因子的遗传变异。有研究将100多名欧洲捐赠者的外周血单核细胞暴露于LPS、热致死结核分枝杆菌或热致死白色念珠菌。在刺激后,作者测量了六种细胞因子,并确定了六个新的QTL,包括两个与结核分枝杆菌诱导的IL-8有关的QTL和一个与LPS诱导的IL-10有关的QTL。他们发现了高水平的多效性,所有全基因组的命中也与病原体诱导的细胞因子反应有关。在将他们的数据整合到国家人类基因组研究所(NHGRI)的GWAS目录后,他们的SNP还与传染病易感性、自身免疫以及奇怪的心脏病有关。后来,同一小组的工作将这一概念扩展到测量巨噬细胞、外周血单核细胞和来自400多个人的全血中的细胞因子,以响应18种不同的致死病原体、TLR配体或代谢刺激。该小组利用他们之前的研究作为复制队列,在17个高度复制的独立基因座中发现了18个全基因组相关的SNPs。TLR1、TLR6位于TLR10位点,多聚肌苷:多胞苷酸(PolyI:C)刺激外周血单个核细胞(PBMC)后影响IL-6的产生。该位点处于正选择状态,表明其在寄主抗性中的重要性。有趣的是,之前的一项研究还发现,在Pam3CSK4刺激全血后,该位点存在一些与IL-6产生相关的SNPs。这种融合突出了TLR 1/6/10信号在细胞因子产生中的重要性,并展示了GWAS识别共同位点的能力,即使是高度分散的细胞也能做到很好识别。

作者的实验团队利用活病原体,使用一种名为Hi-HOST(高通量人类体外敏感性测试)的系统进行细胞GWAS筛查。最初的筛查使用了352个淋巴母细胞系(来自西欧或尼日利亚血统的捐赠者),感染了鼠伤寒沙门氏菌或伤寒沙门氏菌。筛选了与宿主细胞入侵、下睑下垂、细菌复制和细胞内细菌存活有关的QTL。发现rs514182,蛋氨酸挽救酶APIP的eQTL,与鼠伤寒沙门氏菌入侵期间的下睑下垂有关。后续工作显示,APIP通过减少蛋氨酸衍生代谢物甲硫腺苷的丰度来负向调节下睑下垂。相同的基因位点与全身炎症反应综合征、非伤寒沙门氏菌(NTS)菌血症和败血症有关。最后,APIP调节的挽救途径中的代谢物,特别是甲硫腺苷和S-腺苷同型半胱氨酸,是可靠的脓毒症生物标志物,也直接调节鼠伤寒沙门氏菌的毒力。来自Hi-host筛选的另一个热门是rs8060947,它是VAC14的eQTL,与伤寒沙门氏菌入侵相关。VAC14可降低质膜中的胆固醇水平,从而减少伤寒沙门氏菌的对接和侵袭。这种SNP还与伤寒易感性、疟疾风险有关,与NTS、肺炎链球菌、大肠杆菌和不动杆菌菌血症有一定关系。

Hi-host最近进化成Hi-host Phenome Project(H2P2),该计划在8种不同刺激(7种活细菌和真菌病原体和1种细菌毒素)下,从4个群体中筛选出另外528个淋巴母细胞系,用于79种表型。在17个全基因组范围内的显著感染中,有几个表现出多效性,包括位于转录抑制因子ZBTB20的rs953897。Rs953897与沙眼衣原体负荷相关,另外20个H2P2表型在P<0.05。ZBTB20基因敲除证实了三个最强的关联:沙眼衣原体负担和诱导IL-6的产生,以及鼠伤寒沙门氏菌诱导的下垂。此外,将H2P2数据整合到Emerge PheWAS和其他临床数据集中显示,一些顶级的H2P2 SNP与人类疾病有关,包括与HCV易感性有关的ZBTB20 SNP(Rs953897),以及与炎症性肠道疾病相关的CXCL10中的SNP(Rs2869462)。未来的工作是探索H2P2识别的SNPs背后的生物学,并进一步适应Hi-host筛选平台。

虽然这篇综述主要集中在寻找寄主抗性基因的方法上,但以这种方式研究寄主-病原体相互作用有一个需要注意的问题:这些方法通常要求将病原体视为静态的、同质的刺激,而不是将寄主-病原体相互作用的动态和多样化组成部分。将病原体生物学结合到鉴定寄主抗性基因的方法中,包括通过了解细菌多样性的GWAS,具有实质性的价值。

在人类样本中,参与者拥有截然不同的细菌菌株、血清型,这可能会使识别相关位点变得困难,因为病原体多样性会扰乱宿主的反应。传统GWAS的另一种方法是通过对参与者的宿主和病原体DNA进行基因分型,将结果按细菌谱系分层,从而纳入病原体多样性(图1)。这种方法已经应用于结核分枝杆菌,其中一项研究对他们的整个患者队列进行了GWAS,并对感染了北京血统的患者或那些感染了非北京血统的患者进行了单独的GWAS。虽然在汇集的GWAS中没有发现显著的相关性,但研究人员能够找到与非北京血统易感性有统计学意义的关联(rs1418425,CD53和LRIF1之间的基因间,优势比1.62)。这种关联是在他们的主要和复制队列中发现的;然而,有趣的是,注意到这种关联只在年长的个体中显著。

除了这种通过细菌分类学对GWAS进行分层的方法之外,第二种方法涉及使用无假设的基因组到基因组分析,通过测量人类和病原体SNPs之间的关联来确定宿主和病原体遗传学之间的相互作用(图1)。然后,这些信息可以用来通过相互作用的基因对GWAS结果进行分层。基因组到基因组的方法已被证明对携带HIV和HCV的病毒性人类GWAS是卓有成效的。在这些病毒研究中,发现了HLA基因和病毒蛋白之间的多种关联,以及rs12979860(IFNL4中的一个内含子SNP)和HCV蛋白NS5A之间的关联。未来对大型细菌GWAS队列的研究应该考虑对宿主和细菌DNA进行测序,因为识别宿主-细菌相互作用基因可以为了解宿主抗性等位基因和宿主-病原体相互作用提供重要的科学洞察力。

7. 通过双重RNA-SEQ技术探究宿主-病原体互作

在最后一节中,探讨了利用细菌作为生物传感器来反馈宿主承受的压力的技术(图3),这项技术采取了多种形式,包括检查细菌与宿主蛋白的相互作用组,跟踪细菌转录和基因组对宿主的适应,或者同时测量细菌和宿主在感染期间如何相互反应。该技术利用双重RNA测序(双重RNA-SEQ)对宿主-病原体相互作用进行研究。然而,这种方法虽然没有直接暗示宿主基因对抗药性的重要性,但是这些筛选确实识别了能够反馈宿主承受压力的相关细菌,因此代表了一个重要的假设工具。

RNA测序技术的改进使得在体外和体内感染期间捕获和测序宿主和病原体RNA成为可能。这项名为双重rna-seq的技术,直接反应宿主和细菌转录本之间的相关性,提供了二者如何相互反应的初步证据。与传统的转录图谱不同,该项技术需要比较抗性和敏感宿主的转录图谱。Thänert等使用双序列技术了解C57BL/6和A/J小鼠对金黄色葡萄球菌的不同敏感性。来自易感A/J小鼠的感染组织显示炎症和缺氧加剧,这与细菌上调参与厌氧代谢和耐酸的基因有关。这可能会导致这些小鼠与脓毒症相关的死亡。相比之下,耐药的C57BL/6小鼠体内的金黄色葡萄球菌增加了新生氨基酸合成途径、抗菌肽抗性基因和应激反应基因的表达,这表明营养免疫和先天免疫限制了细菌的毒力。

除了动物间的异源性,其他工作还探索了单个动物内细胞间的异质性。一项研究检测了肺泡和间质肺巨噬细胞中结核分枝杆菌的允许性,揭示了宿主代谢和细菌适合性之间的联系。转录差异遵循传统的M1/M2极化模式,肺泡巨噬细胞表现出高脂肪酸代谢和M2样基因表达,从而在入侵的结核分枝杆菌中启动脂肪酸代谢、生长和铁储存。相比之下,间质巨噬细胞更像M1,隔离铁并减少钾和氯的运输,并驱动相关细菌中应激反应基因、铁回收基因和休眠基因的表达。

改进单细胞RNA测序技术将对揭示细菌敏感性的细胞异质性的能力产生重大影响。未来的工作可以应用单细胞双重测序来剖析为什么单个组织内的相邻细胞对细菌感染有截然不同的反应。

图3 病原体信息全基因组关联研究(GWAS)

宿主和病原体DNA的同时测序使得在GWAS研究期间能够捕捉到病原体的多样性,这可以采取两种形式。首先,GWAS可以按细菌菌株分层,因此感染状态的异质性显著降低,个体之间的生物差异更有可能是由宿主遗传多样性驱动的。第二,无假设的基因组到基因组分析寻找细菌和宿主基因组多样性之间的统计联系。这些统计关联可能标记宿主-病原体进化冲突的位置,并暗示宿主基因参与宿主-细菌的相互作用。

许多细菌通过操纵宿主并在细胞内迅速生长。了解细菌进化到与哪些宿主蛋白相互作用可以揭示哪些宿主基因是毒力所必需的。有两种技术可以用来揭示细菌和宿主蛋白之间的相互作用:免疫共沉淀法或基于生物ID的筛选法。最近的一项研究使用了前者,方法是产生15个含有染色体标记效应蛋白的鼠伤寒沙门氏菌突变体,并感染HeLa细胞(一种人类上皮细胞系)和RAW264.7细胞(一种小鼠巨噬细胞系)。感染后,分泌的效应物被免疫沉淀,并用质谱鉴定与宿主相互作用的蛋白。一个类似的BioID筛查在人类上皮细胞中异位过度表达5个BIRA标记的鼠伤寒沙门氏菌效应器,以识别效应器相互作用蛋白。值得注意的是,这些研究的结果有相当大的差异,一些来自感染实验的相互作用未能在BioID论文中复制。缺乏复制可能是效应器过度表达未能模拟感染条件的结果。因此,在设计蛋白质互作组筛选时必须考虑这些系统的优缺点。

上面的例子依赖于这样一个事实,即细菌蛋白经过无数代的进化才能操纵宿主蛋白。然而,基因组方法也可以用于实时研究适应。例如,Croftset al最近的工作。使用空肠弯曲菌的人类感染模型来了解病原体在感染过程中的生物学变化。作者用遗传多样性的空肠弯曲菌感染志愿者,并从参与者那里收集粪便,以便(1)将人类体内的空肠弯曲菌转录组与其他条件下的转录组进行比较,以及(2)追踪人类的选择压力如何影响空肠弯曲菌的进化。作者指出,参与过氧化氢解毒、铁获取和抗菌肽抗性的基因上调,表明细菌对宿主的先天免疫和营养免疫做出了反应。通过研究病原体的基因组适应,作者发现一些突变体在患者之间显示出一致的选择模式。空肠弯曲菌基因组在人类中处于选择状态,提示鞭毛蛋白修饰和/或宿主鞭毛传感在空肠弯曲菌感染过程中起着重要作用。这些实验一起揭开了细菌对人类反应的线索,揭示了宿主选择的压力。

结论

作者讨论了创新技术如何推动了该领域的发展。然而新方法层出不穷,例如CRISPR/Cas9技术的进步可能会扩大CRISPR筛选所涉及问题的范围。此外,虽然许多筛选将入侵病原体作为一个生物常数和/或病原相关分子模式信号,但是通过对宿主和病原多样性的同时筛选,还是可以获得许多重要的信息。未来的体外和动物模型筛选还应考虑病原体多样性,以显著改善宿主-病原体复杂相互作用的建模方式。特别是在合作交叉模型、Hi-HOST或dual-seq等方法中涵盖细菌多样性,可能会产生更加丰富可靠的结果。同样,扩大在自然多样性筛选中测量的独特表型将提高我们对寄主易感性的理解,特别是通过筛选整合实现多效基因座识别。最后,本篇综述涉及的单细胞RNA-seq、表观遗传修饰检测、iPSC分化、高通量显微镜法,流式细胞术和计算工具包等技术革新将彻底颠覆了传统筛选方法,因为它们扩大了可量化表型的数量,提供了单细胞分辨率,并增加了数据吞吐量和统计能力。

原文链接:https://doi.org/10.1016/j.tim.2020.09.006
(0)

相关推荐