可变剪切新模式: 外显子内含子剪切

关于可变剪切,简单而言就是,一个基因从DNA-mRNA的过程当中,由于剪切位点的不同,会形成不同的mRNA剪切变异体。对于可变剪切模式,之前的介绍TCGA SpliceSeq数据库的时候提到了数据库当中包含的其中7种可变剪切模式。具体的可见之前的帖子: TCGA Spliceseq

在这个数据库当中提到的属于经典的可变剪接模式。随着二代测序的技术的使用,也会发现一些额外的剪切模式。比如这次我们要提到的外显子内含子剪切(exitrons(exonic introns) splicing, EIS)。既然二代测序技术可以发现EIS。那么就可以使用TCGA数据库来寻找肿瘤当中的EIS。因此也就可以对肿瘤挡着的EIS事件进行全面的分析。所以也就有了今天我们要介绍的这个文献。

今天就简单的来介绍一下这篇文献吧。

关于EIS

在知道这个文献讲了什么之前。还是要了解一下什么是EIS的。简单来说就是在基因的某一个外显子当中存在5'和3’剪切位点。因此在基因剪切的过程中,会发生外显子缺失一部分的情况。所以就形成了两个不同的剪切体。

基于RNA-seq数据评价EIS的指标:PSO

为了更好的评价TCGA当中的EIS。作者开发了一个软件:ScanExitrons。使用这个软件可以计算评价EIS的指标:PSO(percent spliced out)。PSO这个指标类似于评价可变剪切的一个常规指标PSI。也是代表EIS发生占总的相关转录本的百分比。

文章主要内容

癌症中EIS事件的概况

在计算了一个新的指标之后,第一件事情首先肯定还是有在所有癌的组织当中观察事件的具体分布的。由于TCGA当中的正常组织较少。所以作者也把GTEx里面的正常数据也纳入进来进行分析。

在不同的组织样本存在EIS的样本个数

作者发现,在TCGA癌症样本中,含有EIS基因百分比(62.7%)明显高于GTEx健康人群(17.1%)。这表明EIS在整个癌症转录组中都很普遍。

在肿瘤之间比较的时候,作者发现在卵巢癌(OV)、胃癌(STAD)、食管癌(ESCA)以及急性髓性白血病 (LAML)当中都存在较高的EIS发生率。

同时在正常组织大于40的肿瘤当中对EIS负荷进行meta分析。经过分析,发现肿瘤样品中的EIS负荷比匹配的正常样品中显着更高。

分析了这么多,肯定也是要看差异剪切事件的。所以作者还是对正常样本大于40的这些癌种进行了差异剪切事件分析,经过分析,发现了16个EIS在多个肿瘤当中存在差异。

同时为了分析,EIS事件和剪切因子的关系,作者提取了404个剪切因子的RNA-seq的fpkm表达量,利用这些剪切因子的表达量和EIS事件进行分析。最终发现癌症中的大量EIS事件可能归因于剪接机制的部分破坏。

肿瘤特异性EIS使新型癌症驱动基因的发现成为可能

以上是在整体的肿瘤当中的EIS的情况。为了确定哪些是肿瘤特异性的EIS(TSEs)。作者将一组正常样品(TCGA正常样品和GTEx)与TCGA肿瘤数据进行了比较,以鉴定以下的TSE:(1)未在GTEx样品中剪接,(2)在不超过3个TCGA正常样品中剪接。结果,总共123,338(95.3%)个EIS被认定为TSE。在多个癌种当中,OV,ESCA,STAD和LAML的TSE事件最多。

进一步,作者对这些TSE事件和肿瘤的预后进行了相关分析。经过分析,发现TSE在多个肿瘤当中和预后有关系。

为了确定TSE剪切的功能的影响,作者基于频率统计的方法统计了TSE的涉及的基因(significantly exitron-spliced genes, SEGs)。经过分析最终发现35个基因在COSMIC肿瘤基因谱当中存在差异。

最后作者在前列腺癌当中确定了一个新的驱动基因(NEFH)进行了后续的是实验验证。

SEGs和体细胞突变的关系

在确定了SEGs之后,作者使用SEGs和差异体细胞突变(significantly mutated genes, SMGs)进行了分析。经过分析发现,TSE的发生和SMGs存在互斥效应

为了更详细地研究SEG与SMG之间的关系,作者在PRAD队列当中进行了详细分析,经过分析发现,NEFH是排名最高的SEG,但未显示突变。前列腺癌中已知的SMG(例如TP53和SPOP)未显示EIS。

另外,为了说明SEGs和SMGs对基因蛋白功能的影响。作者通过FOX A1基因对其蛋白结构域在2D和3D水平上进行了分析。经过分析发现FOXA1当中的EIS可能是一种新的功能机制。

另外,在检查所有TCGA肿瘤中的TSE时,我们发现受EIS和体细胞突变影响的蛋白家族(Pfam)域存在显着重叠(p <2.2e‑16),并且有很强的相关性(图4E),表明EIS影响蛋白其功能类似于遗传改变。

除了具体基因的突变。作者又分析了TSEs和TMB,变异等位基因频率和表达突变的变异的关系。经过分析,发现在TSE高的肿瘤样本当中,同时存在高的TMB,变异等位基因频率。

为了进一步了解EIS在肿瘤当中的功能,作者使用MsigDB当中的肿瘤核心基因集中的TSE情况。有趣的是,频繁突变的途径,例如磷脂酰肌醇3-激酶,在任何癌症中均未富含TSE改变。再次证实了EIS可能代表癌症中一种独特但尚未探索的机制的观点,该机制可能与基因组改变互补。

TSE相关的抗原新表位

由于EIS可以编码新的蛋白,所以作者就鉴定出了168,206个推定的新抗原。在所有肿瘤类型中,OV被发现具有最高的TSE新抗原负担(图S6E)。

以上是通过RNA-seq的数据进行分析了。为了准确的寻找新的抗原。作者使用了TCGA的蛋白组学数据来鉴定新抗原。最终鉴定了和TSE相关的28个新表位。最后分析了这28个抗原表位和免疫细胞的相关性。

总的来说

以上就是这个文章的大致内容了。其中有一些基础实验验证的部分,限于篇幅就省略了。如果有兴趣的可以去看一看哈。作者在获得了EIS之后,对其进行了多肿瘤和多组学的分析。同时也发现了肿瘤特异性的EIS在免疫治疗方面的相关性。

(0)

相关推荐