100篇泛癌研究文献解读之APOBECs家族基因突变及表达量异常 | 生信菜鸟团
为了分析不同类型、组织起源肿瘤的共性、差异以及新课题。TCGA于2012年10月26日-27日在圣克鲁兹,加州举行的会议中发起了泛癌计划。参考:https://www.ncbi.nlm.nih.gov/pmc/articles/PMC6000284/ 为此我也录制了系列视频教程在:TCGA知识图谱视频教程(B站和YouTube直达)
所以本研究发表于:Nat Genet. 2013 Sep 是属于较早的一批泛癌研究了,题目很简单:Evidence for APOBEC3B mutagenesis in multiple human cancers. 就是研究TCGA数据库的APOBECs家族基因突变及表达量异常问题。本文献解读属于100篇泛癌研究文献系列,首发于:http://www.bio-info-trainee.com/4132.html
APOBE基因家族
载脂蛋白B mRNA编辑酶催化多肽 (apolioprotein B mRNA-editing enzyme catalytic polypeptide, APOBEC) 家族是一类高效的胞苷脱氨酶, 其转录可被促炎症细胞因子和趋化因子激活, 并在人体的固有和获得性免疫机制中发挥重要作用。
APOBECs家族在抑制病毒复制的同时, 也驱使有促癌作用的病毒突变体形成;其基因编码功能还可以诱发有促癌作用的驱动突变产生。作为在炎-癌转化中发挥桥梁作用的标志性酶, APOBECs家族对癌症的进化发育至关重要。
APOBECs家族成员的活性中心都含有一段或两段保守的特征性模序His-X-Glu-X23-28-Pro-Cys-X2-4-Cys(X代表任意氨基酸),该结构可以发挥针对脊椎动物胞嘧啶核苷酸的脱氨基作用,由于载脂蛋白B mRNA编辑酶催化多肽1(apolioprotein B mRNA-editing enzyme catalytic polypeptide 1,APOBEC1)是第一个被发现的APOBECs家族成员,因此使用这一缩写词作为同类蛋白的前缀。已发现的APOBECs家族成员有11个,包括APOBEC1 (A1)、APOBEC2 (A2)、APOBEC3A~H (3A、3B、3C、3D、3E、3F、3H)、APOBEC4 (A4)以及活化诱导脱氨酶(activation induced cytidine deaminase,AID)。目前除A4功能尚不明确外,APOBECs家族成员均被证明对单链DNA和RNA上的胞苷有脱氨基作用。可以通过诱发靶基因上的胞嘧啶脱氨基成为尿嘧啶(C>U)而发挥多种生理功能。
参考:刘文斌, 邓阳, 于浩义, 曹广文. APOBECs家族成员在癌症进化发育过程中的核心作用[J]. 第二军医大学学报, 2014, 35(12): 1304-1309
全文假设
we hypothesized that APOBEC3B may be a general mutagenic factor affecting the genesis and evolution of many different cancers.
使用管家基因表达量来作为基线
这里作者使用了 housekeeping gene TBP (encoding TATA-binding protein) 来 量化 APOBEC3B的相对表达量,在不同癌症的分布情况。
查看APOBEC3B表达情况和突变上下文
这个时候可以看下面的基础之上,了解突变上下文,既然APOBEC3B表达情况在不同癌症分布不一样,那么作者就探索了APOBEC3B表达情况是否跟突变上下文有相关性,如下:
相关性很不错:(Spearman’s P = 0.0031, r = 0.64).
探究APOBEC3B表达情况和TMB关系
首先看TMB分布
可以看到,每个癌症内部的TMB的中位值和APOBEC3B表达中位值是相关性比较显著的,(Spearman’s P = 0.0013, r = 0.68).
后记
这篇文章在COSMIC的30个mutation signatures分布之前,单独的探索了其中一个signature,现在看来工作量很小,当时却是开创性的工作,这个思路值得我们学习。
当然了,如果你想超脱于他们的泛癌计划已经发表的研究,那么就非常有必要跟着我读完这100篇泛癌文献!
详见我的100篇泛癌研究文献解读目录:http://www.bio-info-trainee.com/4132.html
TCGA教程长期更新列表
TCGA的28篇教程-使用R语言的cgdsr包获取TCGA数据(cBioPortal)
TCGA的28篇教程-使用R语言的RTCGA包获取TCGA数据 (离线打包版本)
TCGA的28篇教程-使用R语言的RTCGAToolbox包获取TCGA数据 (FireBrowse portal)
TCGA的28篇教程-批量下载TCGA所有数据 ( UCSC的 XENA)