生信新思路:泛癌多聚腺苷酸化文献介绍

前几天一直在和大家分享一些关于3'UTR以及3'UTR当中的APA(Alternative Polyadenylation)的东西,为什么要花这么久的时间分享这些呢?主要还是看到了两篇利用 TCGA 数据来挖掘 APA 进行发文章的文献。而其中的一些东西,也是值得我们进行继续挖掘(发文章的)。

今天先和大家分享一篇,是2018年发表在 JNCI(IF = 10.211)上的一篇利用TCGA 数据挖掘 APA 相关信息的泛癌的文章。
文章的主要流程
这篇文章主要做的还是利用 TCGA、ENCODE 细胞系以及 CCLE 药物处理细胞系的RNA-seq数据,通过 DaPars 开发的算法来评价各个样本当中远端 PolyA 位点占比(Percentage of Distal polyA site Usage Index, PDUI)。不了解PDUI可以参考:APA以及PDUI介绍。利用 PDUI 这个值来评价各个肿瘤当中 APA 的发生情况。以及和临床参数另外和药物治疗的关系。
主要结果

1. 肿瘤当中整体APA事件评价

对于一个泛癌的研究,第一部分肯定是要进行整体评价的,这一点作者使用 TCGA 数据库以及 ENCODE 当中几个细胞系的数据来对 APA 事件进行评价。

首先作者总结了这个癌种的APA事件个数。

整体的简单描述完之后,对于组学数据而言,下一步也就是来计算癌和正常当中的差异,来观察哪些APA事件和癌症的发生有关的。
对于肿瘤而言除了 TCGA 的组织信息,细胞系的也是可以总结的。所以对于肿瘤相关的细胞系的 APA 事件也进行了进一步的总结,比较了细胞系和组织之间 APA 的差异来说明组织当中的APA相较于细胞更加的复杂。
2. 主要调控因子和APA的关系
由于 APA 的发生是受到很多因子的调控的,作者汇总了22个主要调控因子,来分析这22个调控因子和 APA 发生的关系。通过分析发现,在22个主要调控因子当中,PABPN1 在各个肿瘤当中都有很强的调控作用。
为了确定 PABPN1 的作用,作者还收集了另外的一个蛋白相关的数据来观察。结果也发现 PABPN1 还是在 APA 相关里面。
确定了 PABPN1 的重要性之后,为了了解PABPN1的功能,对和其相关的 APA 基因进行了富集分析。

3. 药物治疗和APA的关系

利用 CCLE 药物处理的细胞来分析了各个药物作用的 APA 的变化。通过观察发现泛组蛋白去乙酰化酶(HDAC)抑制剂和很多 APA 事件有关系。

4. APA事件和临床特征的关系

比较了 APA 事件和临床特征的差异,发现 CSNK1D 在很多的 APA 事件在很多肿瘤当中存在差异,同时可KIRP肿瘤的预后有关系。另外还发现了NDE1在很多肿瘤当中也存在差异,同时在肿瘤不同分期也存在差异。

文献总结

基本上文献的内容就是这些。当然还是有一些结果是没有提到的。这个如果感兴趣的话,可以再去看文献。这个文献呢,虽然做了所有肿瘤的分析,但是对于每一个肿瘤的分析其实相对来说还是少的,如果我们要针对某一个肿瘤来进行详细分析的话,还是可以分析很多东西的,同时也可以发一些文章的。
如果想要基于某一个肿瘤详细分析的话,我们就需要使用 TCGA 的原始数据来进行分析,但是我们一般能接触到的 TCGA 数据都是加工好的,这个是不能自己来计算 APA的(文献的团队是人家申请的原始数据来分析的)。那么该怎么办呢?如果目标只是来分析肿瘤的内容的话,可以推荐昨天介绍的 TC3A 的原始数据结果。这个结果是在 DaPars 的升级版本 DaPars2 构建的,所以结果可能更加的准确。但是那个数据库只提供了肿瘤的原始数据结果。如果还要看正常的话,那就看不了了。BUT !!!这篇文献提供了他们分析的泛癌的所有 TCGA 的原始数据下载链接。感兴趣的可以去找一下载一下。
(0)

相关推荐