临床生信文章如何补充实验发17分顶刊

Coding and non-coding drivers of mantle cell lymphoma identified through exome and genome sequencing

通过外显子和基因组测序鉴别套细胞淋巴瘤的编码和非编码驱动

一、研究背景

套细胞淋巴瘤(MCL)是一种罕见的侵袭性B细胞淋巴瘤,预后常较差。目前在对MCL的研究中,已经发现了几个常见的突变基因,但因为MCL基因组特征的异质和多样性,有必要进行更大范围的综合探索以进一步了解其生物特性。

二、研究流程

三、结果解读

1.MCL中SSMs和突变基因

在较早的研究中有几个基因被认为是MCL中 simple somatic mutations(SSMs,属于体细胞突变,包括单碱基置换突变及≤200bp的多碱基置换突变和小的InDel)的常见靶标,但在不同研究之间的基因及其突变发生率差异很大。作者认为这种情况既可以归咎于恶性肿瘤的遗传异质性,也有可能是因为每项研究中的队列规模有限。为解决这个问题,作者对51个配对的MCL肿瘤/正常外显子组进行了测序,并与现有的成对外显子组数据共同进行了分析。

对以上队列进行分析后,有16个基因被两种及以上用于识别驱动基因的算法独立判别为突变基因。值得注意的是,通常与体细胞高频突变相关的CCND1是被OncodriveCLUST软件(一般用于鉴定功能获得性突变)鉴别出的。

在候选的MCL基因中,经常发生突变的是ATM ,CCND1 ,TP53 ,WHSC1和KMT2D ,每个基因先前都被其他研究报道过。作者通过至少两种方法独立鉴别得到先前不归属于MCL的三个基因HNRNPH1,DAZAP1和EWSR1。这三个基因都编码RNA结合蛋白,该蛋白在调控包括选择性剪接在内RNA成熟过程中起着重要作用。

2.MCL中的新型突变模式

基于以上结果和较早的研究,作者对18个基因的编码外显子进行了靶向测序,并对34例患者分别进行了全基因组测序(WGS)。作者将测序后分析得出的的变异体信息合并后去除重复项,生成非冗余的变异体数据用于后续分析。

作者发现的MCL基因的突变模式和发生率如图1A ,与其他文献较早的报道基本一致。

图1A:作者分析得出的MCL中常见突变基因

作者查阅文献发现,NOTCH1,MEF2B 和CCND1在MCL和其他癌症中均被报道具有突变热点,但MEF2B在MCL中突变的模式与其他癌症中的不同。

作者进一步研究发现在本次实验中新鉴别到的基因中非沉默突变的发生率通常低于已证实的MCL相关基因,如EWSR1突变为8例(3%),DAZAP1为13例(5%)(图1A ),这样的低发生率可以解释为何在其它实验中这些基因没有被鉴别出来。

EWSR1在MCL中主要为移码或无义突变,在弥漫大B细胞淋巴瘤(DLBCL)中的突变发生率也较低(0.3%),且突变模式与MCL类似,如图1B,上方为EWSR1在DLBCL中的突变位点及类型,下方为在MCL中的突变位点及类型。这提示EWSR1在MCL以及DLBCL中可能具有未知的肿瘤抑制功能。

图1B:DLBCL与MCL中EWSR1的突变模式

DAZAP1具有独特的突变模式,突变聚集在一个包含核定位信号(p.G383-R407)和富含脯氨酸的蛋白结合域(图1C )的C端附近。有9个推测出的截断突变,显示于图1C底部的黑色倒三角,预计每个突变都会去除或破坏核定位信号,但同时大部分开放阅读框保持完整,这样所造成的结果是蛋白质被翻译出来,但无法入核,造成在胞质中的积累。而该区域中的非同义突变主要影响高度保守的氨基酸残基(p.F402,p.R406,p.R407),也可能对核定位信号产生影响。与之对应,的较早的报道显示,这些残基的改变会导致DAZAP1在人肾上皮细胞(293T)和猿猴细胞(COS7)中的细胞质积累。

图1C:DLBCL与MCL中DAZAP1的突变模式

3.HNRNPH1内含子突变破坏HNRNPH1结合基序

作者对MCL的突变基因检测结果做了简要概括,对新发现归属于MCL的3个基因DAZAP1,EWSR1和HNRNPH1,上文已对前两个做了简要分析,而下文作者在分析HNRNPH1的时候,发现了其值得研究的可变剪接模式,故从此开始,作者的研究主要围绕HNRNPH1展开。

同时将编码和非编码突变纳入考虑,作者发现HNRNPH1在272例中的26例发生了突变(10%),整体上来说,其为第八个最常见的突变基因(图1A)。

尽管作者使用的测序方法对内含子的覆盖有限,但内含子变异体是该基因中检测到的最常见的SSM类型,尤其是在外显子4周围的区域。如图2A,可见虽然测序覆盖有限,但轴须图显示只有外显子4周围有密集的SSM位点。配对的肿瘤/正常样本测序数据证实所有常见变异体都属于体细胞突变。WGS数据证实该突变模式局限于此外显子和紧邻的侧翼区域(图2B )。

图2A,B,C:HNRNPH1的突变模式,突变位点及hnRNP结合位点

作者查阅文献发现HNRNP蛋白通过与pre-mRNA特定基序结合并促进或抑制附近剪接位点被使用而广泛参与RNA剪接。与其他核内不均一核糖核蛋白(hnRNP)不同,HNRNPH1(及其旁系同源蛋白HNRNPH2)优先结合于poly-G基序,而具有HNRNPH1突变的患者中有73%的突变影响了该外显子内部或附近的poly-G基序。查阅发现每个受影响的碱基在所有可查询到的的脊椎动物基因组的同源区域中都非常保守,提示其功能的重要性。

通过重新分析两项最新研究的外显子组数据,作者在HNRNPH1的poly-G基序发现了突变位点,进一步提高了结论可信度。作者在最近的一项临床试验中测序的16个复发/难治性MCL外显子组中的三个(16.8%)和另一个最近的研究中的24个中的四个(16.7%)外显子组中观察到了与上述一致的突变模式。在最近的一项临床试验(NCT01646021)上,作者还对145名接受ibrutinib或temsirolimus治疗的患者的诊断性肿瘤组织中对该基因进行了测序,发现其中11例(7.5%)具有上述突变模式,以上证据证明了HNRNPH1的突变具有高度可复现性。

为了探究HNRNPH1的突变是否在不同疾病中存在共性,作者分析了Burkitt淋巴瘤,DLBCL,慢性淋巴细胞性白血病和滤泡性淋巴瘤现有的WGS数据,但仅发现了两名HNRNPH1突变的DLBCL患者(1.3%),提示在MCL中上述突变是具有特殊功能的驱动突变。这种高度可复现的突变模式提供了强有力的证据证明了这些突变具有调节功能,而因为突变处在poly-G基序,故最有可能影响HNRNPH1 mRNA的表达和/或剪接。考虑到HNRNPH1突变在类hnRNP结合基序的序列中的普遍性,作者推测HNRNPH1蛋白通过调节HNRNPH1转录物的剪接调控其自身表达。为了证明上述推论,作者重新分析前人的HNRNPH1的iCLIP-seq数据,确认了HNRNPH1与其pre-mRNA之间的包括外显子4在内的多个互作位点(图2C)。

作者通过分析RNA-seq数据发现HNRNPH1具有多种亚型(图2D),包括几种由于跳过外显子4而产生的转录本,这些转录本被预测为无义介导的衰变(NMD)的靶点。

图2D:HNRNPH1的亚型        尽管这些poly-G基序中的突变不直接影响经典的剪接信号,但因为上述观察到的情况,作者假设他们会影响外显子4保留或跳读,因此作者分析了HNRNPH1突变状态已知的RNA测序数据,以评估突变和未突变肿瘤的剪接差异。通过比较支持外显子4被剪接与跳读的reads数,作者发现与HNRNPH1的突变与否相对应的外显子4跳读率有显著差异(P=1.13x10^-5,Wilcox秩和;图2E)。 (图2E、F中y轴标签有些混乱,我们可以把y轴理解为外显子4被跳读的情况占保留+跳读情况之和的比例。)

图2E:HNRNPH1突变与剪接情况

为了证实上述结果,作者实施了微滴式数字PCR(ddPCR),以分别量化经典和外显子4被跳读的HNRNPH1转录本。通过该分析,作者证实了上述差异分析的结果(P<0.001; 图2F)。

图2F:ddPCR中HNRNPH1突变与剪接情况

以上结果支持以下观点:突变破坏了HNRNPH1与外显子4周围的poly-G基序的结合,有利于第4外显子的保留或者说抑制该外显子的跳读,减弱了正常的反馈抑制作用,从而促进了全长转录本的形成

4.HNRNPH1剪接与MCL的预后评估

为了验证了这项研究中确定的突变是否与患者预后相关,作者使用具有现成的生存数据的所有病例,以及接受R-CHOP化疗方案的病例子集进行分析。在单变量差异分析中,NOTCH1(HR=2.05; FDR=8.6x10^-2)或TP53(HR=3.38; FDR=2.8x10^-7)的突变与更短的总生存期相关。在用R-CHOP治疗的患者中,NOTCH1(HR=2.38; FDR=3.6x10^-2 )和TP53(HR=3.53; FDR=8.4x10^-6)突变也与预后显著相关,与作者查阅到较早的的报告一致。此外,在R-CHOP治疗的病例中,EWSR1与较短的总生存期(OS)相关(HR=8.71;FDR=3.5x10^-3 )。但当这些患者被包括HNRNPH1在内的其他基因的突变状态分层时,却未观察到与预后的显著关联。

作者分别评估了ibrutinib或temsirolimus治疗的复发/难治性MCL患者中HNRNPH1突变状态对预后的影响。由于样本数量有限,作者在本研究中同时考虑试验两臂的患者。与R-CHOP队列相比,具有HNRNPH1突变的患者的无进展生存期(PFS)明显较短(图3A),该结果进一步支持了HNRNPH1突变对MCL进展的影响。

图3A:HNRNPH1突变与无进展生存期的关系

考虑到HNRNPH1选择性剪接与表达之间的紧密联系,作者认为含有外显子4的HNRNPH1 mRNA的比例可以代替HNRNPH1蛋白的表达情况。故作者基于所有具有HNRNPH1突变的病例的中位数,选择了一个保守的mRNA比例作为阈值来对外显子4保留/跳读的病例分层。在具有现成的RNA-seq数据的患者中,这种分层显示HNRNPH1异常剪接(外显子4被保留,形成全长转录本)的患者的OS明显缩短(图3B;HR=2.50;P=0.00388)。将剪接比率视为连续变量分析的结果也表明其与OS显著相关。

图3B:HNRNPH1外显子4比例与总生存期

另外,作者还进行了多变量Cox回归分析,发现TP53,blastoid(MCL中一个形态学特征)和HNRNPH1异常剪接与不良预后相关(图3C)。

图3C:对MCL的多因素Cox回归分析

依据上述结果,作者得出结论:HNRNPH1的异常剪接模式是MCL中独立于现有的遗传和形态学特征的,可用于预后评估的新型生物标志。

5.突变和可变剪接影响MCL中HNRNPH1蛋白的表达

作者假设poly-G中的HNRNPH1结合位点突变破坏了负反馈回路,该假设预示着HNRNPH1突变肿瘤中HNRNPH1蛋白表达量较高。为证明这个假设,作者通过免疫组化评估了HNRNPH1蛋白在不同样本中的表达(图4A),并将免疫组化结果与测序数据进行相关分析。与作者的假设一致:具有较高染色强度(即HNRNPH1高表达)的组织常伴随HNRNPH1基因突变(P=0.0007214,Fisher精确检验);具有异常剪接的病例也与较高染色强度的组织相关(P=0.001251,Fisher精确检验);具有中等和强染色强度的组织对应的异常剪接比率分布明显不同(图4B)。

此外,根据RNA-seq数据,在高染色强度的情况下,HNRNPH1的总mRNA水平不会显著升高(图4C)。这表明经典转录本的相对比例与总mRNA丰度相比,前者与HNRNPH1蛋白的表达更直接相关。作者先前的发现显示了 productive 剪接(指保留外显子4的剪接)与存活之间的关联(图3A),与作者对不同HNRNPH染色强度对应的随访数据进行的生存分析观察到的趋势一致——强HNRNPH1染色对应更短的生存期(图4D)。

图4:HNRNPH1蛋白的表达与突变、可变剪接及预后的联系

6.常见的HNRNPH1突变破坏了有效的剪接和翻译

在上文中将外显子4被跳读产生的mRNA预测为NMD的靶点,为进一步证实,作者做了体外实验:使用了真核细胞翻译抑制剂环己酰亚胺抑制了这一过程(因为在NMD中翻译过程起重要作用)。在3个MCL细胞系(JVM2,REC-1和Z-138)和HEK细胞中。作者证明了经环己酰亚胺处理后,与总HNRNPH1转录本(经典+变异体)相比,unproductive HNRNPH1转录本显著增加,且这种增加是剂量依赖性的(图5A)。在原癌基因SRSF3中被证明有与HNRNPH1中相类似的剪接模式,使用环己酰亚胺处理的结果(图5B)与HNRNPH1类似。这些结果表明,缺乏外显子4(异常剪接)的HNRNPH1亚型在MCL细胞中以NMD依赖性方式降解。

图5A,B:不同细胞中HNRNPH1,SRSF3的剪接比率与环乙酰亚胺剂量的关系

为了从功能上证明在MCL中发现的突变会破坏剪接的调控,作者构建了一个 minigene,其中包含HNRNPH1基因外显子2至6的序列及所有内含子序列。minigene 的 productive 剪接产物将在翻译中产生C末端包含血凝素(HA)标签的全长肽。由于外显子4被跳读而形成的 unproductive 剪接产物使C末端处于阅读框外,缺少HA标签(图5C)。

图5C:不同剪接情况下的蛋白表达

作者瞬时转染了minigene以及带有EGFP标记的HNRNPH1 cDNA的载体进入HEK细胞,发现HNRNPH1的异位表达显著削弱了HA标签的表达,表明包含HNRNPH1的minigene从 productive 剪接变为 unproductive 剪接。如图5D,EFGP标记主要是为了验证转染成功,而HA标记可以提示我们外显子4的剪接情况,组蛋白H3作为内参。从图中可以看出,转染后HA标签表达明显下调。

随后,作者进行了 rescue 处理,通过定点诱变分别生成了该 minigene 的三个不同变异体(图5E),并将每个变异体瞬时转染到HEK细胞中。三个突变对应的变异体中任何一个的存在均显著增加了带有HA标记的肽的丰度,换句话说,也就是外显子4的跳读被抑制从而形成了全长转录本(图5F)。该处理的结果表明对于正确调节HNRNPH1剪接而言,所有三个poly-G片段都起到关键作用。

作者依据以上结果构建了一个模型,模型中,HNRNPH1中的突变破坏了其蛋白对自身的负反馈调节,并促进了HNRNPH1蛋白的表达,实验结果可以对作者的模型形成有力支撑。

图D,E,F:通过minigene技术进行的HNRNPH1突变与剪接调控关系的验证

在这里,我们可以梳理一下关于作者对于HNRNPH1可能存在的调节过程的假说——HNRNPH1基因转录生成pre-mRNA,其中含有一些位点可被HNRNPH1蛋白结合,从而影响可变剪接过程,产生的缺少外显子4的mRNA会以NMD方式降解,可认为是对自身的负反馈调节。当HNRNPH1基因对应pre-mRNA处于poly-G基序的某些位点发生突变后,HNRNPH1蛋白对pre-mRNA结合受到影响,产生更多的含有外显子4的全长转录本,这些异常的剪接产物占比变多使HNRNPH1蛋白高表达而造成不良预后。

小结

作者“广撒网,多敛鱼”,使用了外显子、全基因组、靶向以及RNA测序获得了大量测序数据,而后使用多种分析工具并结合前人的研究结果进行了大量分析,最终“择优而从之”,锁定了HNRNPH1基因,并通过RNA-seq,免疫组化,minigene,rescue实验,生存分析等生物技术或分析方法验证了HNRNPH1的突变与其可变剪接、表达和负反馈调节以及预后等因素存在的联系,并提出了其在MCL预后评估中的意义,数据详实,论证条理清晰,值得我们参考。

(0)

相关推荐