纯生信4+人核受体基因家族表达谱与泛癌预后
Pan-cancer analyses of human nuclear receptors reveal transcriptome diversity and prognostic value across cancer types
人核受体的泛癌分析揭露了在不同癌症中的转录多样性以及预后价值
一.研究背景
人核受体超家族对人的生理和病理过程起着重要调控作用,它们也一直作为某些疾病的标志分子,药物治疗的靶点。然而核受体的表达模式还和癌症病人的预后情况之间的关系还是未知,作者想要通过高通量数据研究泛癌中核受体基因的表达模式,以及不同核受体基因的表达模式和病人预后的关系,从而为未来治疗癌症药物的研发寻找新的核受体基因靶点提供证据。
泛癌作者从TCGA的Broad GDAC Firehose 数据集中获取了8526个肿瘤样本和627个正常样本的RNA-seq数据。人数为8526的泛癌病人群体包含了33种癌症以及11种泛癌器官系统(pan-organ system),如表1中所示。其中ESCA被分为ESCA_A (esophageal adenocarcinoma)和ESCA_S (esophageal squamous cell carcinoma)。为了方便,下文的疾病名称同一用表中的缩写。
表1. 泛癌及泛癌器官系统
人核受体基因
人的核受体(Human nuclear receptors NR)是由48个进化上相关的转录因子组成的超家族,他们通过和配体结合以及招募协同调节分子来调控目的基因的转录活性。早期系统的研究根据序列相似度将核受体超家族划分为7个亚家族(classⅠ-Ⅵ以及缺少DNA结合结构域的class0)。文章中将所有的核受体基因的相关信息用表格汇总(表2)
表2. 48种核受体基因信息汇总
二.分析流程
三.结果解读
1.对RNA-seq数据分析定义了肿瘤中4种主要的核受体基因表达模式
首先利用TCGA数据库中8526个病人的RNA-seq数据对48种人类核受体的表达模式进行分析,每种NRs在不同癌症癌组织的表达模式根据总表达量(单位为log10 normalized RSEM)的四个分位数分为absent(inf-25%),restricted(25-50%),widespread(50-75%),ubiquitous(75-100%) 这四个模式。并对不同癌症中NRs的表达模式进行分析。其中22种NRs(占46%)在癌组织中,尤其是在属于妇科、泌尿科和胃肠道泛癌器官系统的癌症中呈现为Restricted模式。图1用热图展示了8526个病人RNA-seq数据中48个核受体基因的表达情况,用Manhattan距离和Ward法对样本进行层次聚类。很好的将病人群体根据肿瘤种类和泛癌器官系统进行了聚类(图的上端),而在对NRs的聚类中,没有能很好地根据NRs的种类进行(图的左侧)。这说明NRs所属的种类不能很好的代表其在不同癌症中的表达模式。
图1. 人核体基因在泛癌中有相似的表达模式
2.根据核受体基因表差异和显著性寻找肿瘤相关的人核受体基因
在总结了NRs在泛癌中的表达模式后,为了识别癌症相关的NRs,将16种(16/33)癌症一共5507个样本的NRs的mRNA表达数据与对应正常组织(n=627)的mRNA表达数据进行比较(因为数据库中没有其余几种癌症的正常组织基因表达数据)。用Wilcoxon进行组间差异的检验,并用热图展示了校正后的p值(图2.A)。在展示的肿瘤类型(n=16),有23-41种NRs差异表达(图2.B)。LUSC(肺鳞状细胞癌)中有42种NRs基因差异表达,数量最多,其它拥有较多肿瘤相关NRs的癌症有KIRC(41个),BRCA(39个)等,而GBM中与肿瘤相关的NRs最少(23个)。每一种NR都至少在5种癌症中有差异表达(图2.C)。由图C还可以看出大部分核受体基因在多种癌症中是低表达的,例如NR3C2,PGR,RORA在16种癌症中都存在着差异表达;而HNF4G只在5种癌症中其中显著差异表达。
图2. 人核受体基因在正常组织和癌组织中差异表达
将拥有最多数量肿瘤相关NRs的LUSC样本中的各个NRs在癌组织和正常组织中mRNA表达差异用箱线图的形式展示。图中蓝色表示肿瘤组织,黄色表示正常组织(图3)。可以看出有很多NRs在肿瘤组织和正常组织中表达有显著差异。
图3. LUSC癌组织和正常组织中核受体基因表达情况
4.寻找泛癌中NRs的共表达模式
首先用相关性热图展示了所有21种肿瘤组织中的48种核受体基因mRNA表达量的相关性(图4.A)。分析了肿瘤中NRs表达有显著正相关性的三个基因集。它们在图A中的对角线上呈现出三个蓝色正方形(蓝色表示正相关,红色表示负相关,程度与颜色深度呈正比)。
第一个包含NR4A1、NR4A2、NR4A3(属于class Ⅳ)
第二个包含了AR、 ESR1、ESRRG、NR2E3、NR3C2、PGR、RORC、THRB (分属于 class I/II/III)
第三个包含了HNF4A、NF4A、HNF4G、NR0B2、NR1H3、NR1H4、NR1I2、NR5A2、PPARA、PPARG (N分属于class 0/I/II/V)
之后对21种癌组织中48种NRs的mRNA表达情况进行相关性分析并用相关性热图呈现,图4B-C展示了BRCA、ESCA、PAAD三种肿瘤组织中的NRs表达相关性。作者发现,不同种类的肿瘤组织中大多NRs的表达与其它NRs表达呈现显著弱相关至中等相关(0.2<|r|<0.6);在某些肿瘤如BRCA中,核受体基因ESR1,AR,PGR和RARA的mRNA表达量呈强正相关(r>0.6);在THYM中,PPAR,RAP等属于class Ⅰ的NRs有较强的共表达;而NRs class IV基因(NR4A1、NR4A2、NR4A3)在20种肿瘤中(除了SKCM)有交互表达。
图4. 不同癌症中核受体基因的表达相关性热图
5.48种核受体基因的预后显著性依赖于癌症的种类
作者把21种癌症病人根据每种NRs的mRNA表达量的中位表达值作为cut- off,分为特定NRs的高表达组和低表达组,之后对21种癌症病人的总生存时间(overall survival time OS)根据每一种NRs的表达情况进行生存分析(使用web-based Kaplan-Meier plotter tool)。将所有的生存分析的log-rank test p-values用热图的形式展示(对p值取-log10处理),同样还是用Manhattan距离和Ward法进行层次聚类(图5A)。许多不属于同一类的核受体基因和不属于同一类泛癌器官系统的样本被归为一类,故预后水平不能很好的用泛癌器官系统或NRs的分类来概括,而是依据癌症的种类来定。总的来说,不同癌症中有6-37种NRs与病人的预后显著相关,其中有最少NRs与病人预后显著相关的癌症是TGCT(6种);有最多NRs与病人预后相关的癌症是KIRC(37种)(图5B)。不同NRs在5-13种癌症中与病人预后显著相关(图5C),所以尽管大部分NRs在每种泛癌中低表达(图2C),NRs基本上都和癌症病人预后显著相关。
图5. 核受体基因在一些癌症中有预后价值
6.每一种核受体基因的预后显著性在同一种泛癌器官系统中的不同癌症也不同
作者在对KM生存分析的结果的分析中得知,NR2E1是唯一一个在同一种泛癌器官系统(妇科泛癌)的所有癌症病人中保持着相似的表达模式,即高表达预示着更低的OS。而其它47种NRs在同一泛癌器官系统的不同癌症中的表达模式不相同。为了进一步说明NRs与癌症患者的预后关系在不同癌症中不同,不能根据泛癌器官系统或NRs的类别进行判断,作者以核受体PPARG为例,在癌症BLCA中,PPARG高表达与更好的预后相关;而在癌症LIHC中,PPARG低表达与更好的预后相关(图6A-B)。图6C用森林图展示了19种癌症中PPARG表达量对OS的单因素Cox回归分析结果:高表达的PPARG在5种泛癌种起到保护作用,预示着更好的预后水平(HR<1);在7种泛癌中起到负作用,预示着更差的预后水平(HR>1)。注意有一共展示的19种泛癌中有7种,PPARG对其预后的影响不显著(p>0.05)。
图6. 核受体基因PPARG在一些泛癌中有显著的预后价值
今天分享的文章从48种人核受体基因入手,研究其在泛癌中的表达情况,预后价值,前后连贯,思路清晰,值得我们借鉴学习。好啦,这期的套路解读就到这里了,让我们下一次继续新文章的解读,拓展新的思路,下期再见。
编辑:炒年糕
校审:糯米饭