科研 | GENETICS in MEDICINE:血液RNA分析可以提高临床诊断率并解决不确定意义的变异

编译:alin,编辑:十九、江舜尧。

原创微文,欢迎转发转载。

导读

通过二代测序(NGS)技术发现了大量不确定意义的基因变异(VUS),但由于对其功能不完全了解和对基因型-表型相关性理解的匮乏,严重影响了我们对基因变异致病性的判别,也阻碍了遗传病的诊断鉴别。大量的基因变异可能会扰乱正常的RNA剪接。通过血液RNA剪接分析技术可识别临床诊断上重要的剪接异常,并可阐明大部分VUS的功能。生物信息学预测基因变异会影响剪接的部分,虽然存在局限性,但也表明基于RNA水平仍值得深入研究。因此,RNA分析在遗传病诊断中应纳入常规考虑。

论文ID

原名:Blood RNA analysis can increase clinical diagnostic rate and resolve variants of uncertain significance

译名: 血液RNA分析可以提高临床诊断率并解决不确定意义的变异

发表期刊:GENETICS in MEDICINE

影响因子:8.683

发表时间:2020.3.3

通讯作者:Diana Baralle

作者单位:英国南安普顿大学医学院

DOI号:10.1038/s41436-020-0766-9

实验设计

对来自三个实验室的257个基因变异(编码和非编码)进行分析。提取血液RNA样本进行定向逆转录聚合酶链反应(RT-PCR)分析,随后PCR产物进行Sanger测序和琼脂糖凝胶电泳。同时,对其中17个样本进行了RNA测序,并基于sashimi plot(一种专用于可变剪接分析可视化的图表)进行了靶向剪接分析。使用Alamut、HSF3.1和SpliceAI软件获得生物信息剪接预测。

结果

1 影响RNA剪接的变异体

本文总共评估了257个不同变异对RNA剪接的影响(表S1)。 其中243个变异是单核苷酸变异,14个变异跨越多个核苷酸(10个缺失,1个插入,2个缺失插入和1个顺式单核苷酸变异(SNV)缺失)。变异总共位于62个基因中,其中BRCA1(42),BRCA2(42)和FBN1(87)的变异数量较多。同时研究发现有85个变异(占3 3%)与异常剪接有关。在57个单核苷酸变异中,有44个(77%)位于供体剪接位点或剪接区域内(由序列自身定义为从外显子的第三个碱基延伸到内含子的第八个碱基)和13/19个位于受体剪接位点或剪接区域内(从内含子的第八个碱基到外显子的第三个碱基)的单核苷酸变异(68%)被观察到会改变剪接。175个变异没有涉及带注释的剪接区,其中有23个(13%)是受影响的剪接区(21/167个单核苷酸取代)。

研究表明有39个变异与上游外显子的跳跃有关(该变异更靠近外显子的供体剪接位点而不是受体剪接位点),这是最常见的剪接异常。但是,分析后发现同类群组包含相对较少的受体区域变异,仅有15个变异与下游外显子跳跃相关。这些外显子跳跃包含上游和下游外显子同时都被跳过,以及一种双上游外显子跳过的情况。23个变异可诱导替代剪接供体位点被启用,16个变异可诱导替代剪接受体位点被启用内含子保留仅与三个变异相关。对于4个变异,常常可鉴定出多个剪接异常。

图1 变异的位置和变异对剪接的影响(a)在该队列中,随着每个供体(D-3至D + 8)和受体(A-8至A + 3)剪接位置的出现,从单核苷酸变异(SNV)数量(不包括多核苷酸变体)的直方图中发现其中一些可影响剪接。(b,c)剪接供体上核苷酸序列的位置-权重矩阵。(b)受体(c)这项研究中确定的特定外显子-内含子连接确定的区域。在该图中,供体剪接位点+1位置与(b)中的位置12相关,而受体剪接位点-1位置与(c)中的位置25相关。(d)通过SNV位置绘制的异常剪接效果。序列自身将供体剪接区域定义为从外显子的最后一个核苷酸(D-3)延伸至内含子的第八个核苷酸(D + 8),而受体剪接区域则定义为从内含子的最后一个核苷酸延伸(第八个核苷酸)(  A-8)到外显子的第三个核苷酸(A + 3)。(e)在此队列中影响剪接的所有变异的总比例。 (f)在该队列中发现的不同异常剪接事件的比例。 A3SS替代3´剪接站点; A5SS替代5´剪接位点,IR内含子保留,SE跳过外显子。

2 说明性实例

该研究中的几个实例与跨不同变异看到的剪接变化有关(图2)。

图2说明性实例的变异剪接分析。 DKC1 c.915 + 10G> A不能通过逆转录聚合酶链反应(RT-PCR)和Sanger测序来鉴定,但供体剪接位点的替代用途是通过RNA-seq鉴定的。 P3H1(LEPRE1)c.1224-80G> A使用替代的剪接供体和受体位点,使内含子保留水平提高并引起至少三个异常剪接。 DCTN1 c.414 + 1G> A可能改变了典型的剪接供体位点,虽然第5-7号外显子已注释,但从未表达,而是构成了剪接。 虽然SF3B4 c.417C> T是同义的编码变异,却形成了125 nt的“外显子”,即外显子内的内含子区域。 A3SS替代3´剪接位点,A5SS替代5´剪接位点,Ctrl控制,Pt患者。

2.1 RNA-seq检测Sanger测序遗漏的剪接变异

在一名男性先天性角化不良患者中发现半合子基因DKC1 c.915+10G>A变异,RT-PCR产物的直接Sanger测序结果正常(图2)。同样,凝胶电泳的结果也是如此。然而,RNA-seq揭示了一个新的内含子供体剪接位点的形成,其中包含11个额外的核苷酸。随后通过异构体特异的RT-PCR和基因测序也证实了这一点。新基因组合的PSI值为20%,PSI的计算方法为统一长度的包含读数除以统一长度的包含和排除读取总数。

2.2 复杂的深层内含子变影响剪接

在一例成骨不全患者中,鉴定出杂合子P3H1(LEPRE1)c.1224-80G>A变异。RT-PCR和PCR产物测序试验均显示有多种不同大小的条带,至少可鉴定出4个选择性剪接,包括内含子保留、两个新的内含子剪接供体位点(插入68或92nt)的建立,以及一些其他的外显子剪接受体位点的使用(插入92nt的内含子序列和缺失外显子8的前17nt)。RNA-seq分析只能确定两个内含子剪接供体位点之一的用途。经计算机算法预测分析有趣的是,保留内含子的氨基酸序列(包括那些利用新内含子供体位点的氨基酸序列)会导致在外显子7结束后立即引入提前终止密码子。

2.3 所有的典型的变异不一定有重要意义

根据NM_004082.4预测,内含子5中的一个杂合的典型剪接供体位点DCTN1c.414+1G>A变异会破坏剪接。然而,该变异在拉丁裔人群中存在相对较高的次要等位基因频率(MAF),即3×104,在gnomAD数据库中为6 4×105(Rs576198476)。RT-PCR分析证实DCTN1外显子5-7实际上在该患者和对照组中都被结构性地跳过,否定了该变异引起的任何潜在的剪接效应。

2.4 一个深层外显子的隐蔽剪接位点

BRCA1外显子15供体剪接位点上游的这种杂合BRCA1 c.4868C>G颠换119nt,即在1623位氨基酸引入保守的丙氨酸取代甘氨酸。然而,RNA分析表明,该变异实际上在该位置创建了一个外显子隐蔽剪接供体位点,导致转录本119-nt的缺失和移位。

2.5 “可能良性”内含子变异也可导致病原性外显子跳跃

从外显子18开始上游的杂合非编码BRCA1c.5153-26A>G转换26nt在ClinVar上被注释为“可能为良性的”(Rs80358109)。然而,RNA分析证实,该变异导致下游外显子18的跳过,形成框架外转录本。虽然没有预测到对天然剪接受体位点的影响,但这些预测工具的遗漏提示了一个新的隐蔽受体位点存在。

2.6 深层的内外接效应

位于第3外显子254nt的杂合SF3B4c.417C>T同义变异可能导致选择性剪接位点增强。RT-PCR分析证实了另一个深层外显子剪接供体位点的产生。然而,发现这个新的供体位点也与SF3B4外显子3内新的剪接受体位点相耦合,导致外显子内125nt的缺失。此前已经报道过使用微型基因检测该变异的效应。

3 RNA-seq检测覆盖范围

对17个样本进行了RNA-seq分析。在四个案例中,RNA-seq能够检测到的剪接异常与初步RT-PCR结果一致。在一例(DKC1)中,RNA-seq发现了RT-PCR最初未检测到的剪接异常。在另一例(SF3B4)中,RT-PCR发现的剪接异常仅在两次RNA-seq读取中可见,因为其低于RNA-seq结果报告阈值。在其他11例中,未检测到可报告的剪接异常。值得注意的是,剪接检出覆盖深度在被检测的基因之间和基因内也有相当大的差异,这些情况限制了RNA-seq检测低水平剪接作用的能力。

4 生物信息学剪接预测

研究者使用Alamut Visual(v2.11)对所有变异进行评分,包括MES、NNSplice和SSF,还使用HSF和SpliceAI。计算了14,15,17A组合Alamut得分,如果Alamut内的三个单独工具中的两个超过定义的阈值,则认为这个变异可预测影响剪接。表1给出了每个工具和Alamut综合评估的总体灵敏度、特异度、准确性、阳性预测值和阴性预测值,这是基于每种方法评分的所有变量得出的。图3显示了基于所有工具评分的重叠变量集的具有AUC值的ROC曲线。在所有考虑的指标中,SpliceAI在预测所有工具/方法的剪接中断方面表现最好,总体准确率超过90%(参见表1)。

表1计算机预测工具对经过实验验证的变异(n = 257)的性能评估。

计算得出的值省略了每种工具的缺失分数。 HSF人工剪接查找器,MES MaxEntScan,NPV阴性预测值,PPV阳性预测值,SSF剪接部位查找器。 a11变异缺少一个分数,三个变异缺少两个分数。

图3用于预测异常剪接的生物信息学工具。接收器工作特性(ROC)曲线和曲线下面积(AUC)通过计算机方法比较测得的重复性实验验证变异中的剪接破坏(136种非剪接破坏,70种剪接破坏)。 HSF人工剪接查找器,MES MaxEntScan(Alamut),NN NNSplice(Alamut),SSF SpliceSiteFinder(Alamut)。 Ala23 =超过指定阈值的Alamut工具数量。

结论

这项研究阐明了250多个VUS对临床重要疾病基因剪接的影响,并发现其中34%的VUS影响剪接。本研究结果表明,使用RNA-seq进行RNA剪接分析能够产生清晰的结果,从而有助于阐明变异。在这项研究中,只有30%的变异属于带注释的剪接区,而13%的非剪接区域变异仍影响剪接。随着基因组测序的使用越来越广泛,通过临床诊断测试将鉴定出越来越多的内含子变异。虽然剪接区域以外的此类变异的解释仍然不确定,但通过RNA分析可以检测到此类变异潜在的剪接效应。此外,“可能为良性”的剪接变异、正常剪接变异以及隐蔽性的剪接变异都将对RNA的剪接带来影响。与RNA-seq相比,RT-PCR对检测诸如剪接外显子的剪接异常更为敏感,因为靶向扩增的检测限非常低。但是RT-PCR和Sanger测序并不是真正的定量方法,并且存在优先扩增较短产物的偏倚。相反,RNA-seq可以通过计算的基于读取的指标(例如PSI值)提供更可靠的剪接同工型定量分析。针对目标基因区域进行有针对性的RNA-seq文库制备将可能成为提高检测范围的另一种潜在方法。虽然是生物信息剪接预测工具,尤其是SpliceAI可预测90%以上变异,其准确性也在不断提高,但机器预测的偏差依然存在,仍需要进一步改善。因此,在评估变异对剪接的影响时,不能完全依靠它们,应首先获得通过实验得到的RNA剪接证据。由于RNA剪接的微妙和复杂性(图4),将需要更深入的工作来确定如何将计算机算法剪接预测和实验剪接分析最优的结合起来纳入变异分类指南。总之,这项研究证明了血液RNA分析在阐明意义不明的基因变异效应和提高诊断率方面的潜力。

图4潜在的剪接破坏模型。在上游剪接完成的情况下,剪接供体或受体位点变异可能导致内含子保留。在先前的剪接还未完成的情况下,剪接供体变异可能会导致上游外显子的跳跃。类似地,如果剪接受体位点变异导致上游剪接供体位点保持未使用,则这可能导致跳过受体位点变异下游的外显子。产生或增强隐蔽剪接位点的外显子或内含子变异可导致使用替代的剪接供体或受体位点。


更多推荐

科研 | PNAS:转录组学揭示急性和慢性饮酒对肝脏昼夜新陈代谢有不同的影响

重磅综述 | Cell:非编码RNAs在肿瘤学中的作用(IF=36.216)

(0)

相关推荐