5+分思路:非编码RNA结合临床预后进行分析

A nomogram combining long non-coding RNA expression profiles and clinical factors predicts survival in patients with bladder cancer通过lncRNA表达谱和临床因素相结合的列线图来预测膀胱癌患者的生存期

一. 研究背景

在对膀胱癌(BLCA)的临床治疗当中,TNM分期以及淋巴结状态往往用于评估BLCA的预后。但该项评估仅仅基于固有的解剖信息,并且由于BLCA的生物学异质性,临床上很难预测疾病的进展,因此需要可靠的生物标志物来预测BLCA患者的预后并指导治疗。

lncRNA通过与核酸、蛋白质和其他大分子结合,发挥精细的调控作用,最终推动肿瘤的发生和转移,是一个巨大的潜在的癌症治疗靶点库。有研究报道lncRNA可以标记肿瘤的进展,甚至预测结果,作者基于此展开对BLCA的研究。

二. 分析流程

三. 结果解读

1. 与BLCA患者总生存期相关的候选lncRNA

图2. 膀胱癌患者的差异表达lncRNA

A图:(数据来源:TCGA) 826个差异表达lncRNA的火山图

B图:(数据来源:TCGA) 826个差异表达lncRNA的热图

补充图1. 膀胱癌患者的差异表达mRNA

作者通过TCGA数据库,比较414例BLCA患者和19例正常人的lncRNA和mRNA表达谱,确定了826个差异表达的lncRNA(DEL,图2);以及1841个差异表达的mRNA(DEM,补充图1)。排除了4例生存资料不足的患者后,作者对DEL进行单因素Cox比例风险回归分析(CPHR,补充表1)以及K-M生存分析(补充图2)。

补充表1. 与总生存期显著相关的候选lncRNA

Cox回归分析显示,11个lncRNA与BLCA患者的总生存期显著相关,其中10个lncRNA(除SMC2-AS1)的危险比(HR)大于1,即其过表达与更短的总生存期相关;而SMC2-AS1的HR<1,其过表达与总生存期增加相关。K-M分析曲线结果与CPHR一致。

补充图2. 与候选lncRNA表达高低相关的K-M曲线

2. 用于生存预测的三lncRNA标志的识别与验证

表1. BLCA患者的临床特征

作者再次排除了34例没有缺少TNM分期和年龄等临床特征数据的患者,随机定义剩下一半患者为”primary dataset“,而整体患者为”entire dataset“,两组间临床特征无显著性差异(表1)。

表2. 三种lncRNA与患者的总体生存期显著相关

为了确定与总生存期相关的最佳lncRNA标志,作者通过多因素CPHR分析,确定了3个lncRNA(表2),并计算其风险评分,风险评分公式为:

其中,Exp为lncRNA的表达值,C为多因素Cox回归分析中相应的系数。

图3. "primary dataset"中对三lncRNA标志的验证

A图:(数据集:primary dataset) 三lnc标志的风险评分分布、生存状态和热图

B图:(数据集:primary dataset) 高/低风险组的K-M曲线

C图:(数据集:primary dataset) 预测3/5年时生存期的ROC

作者根据风险评分的中位数,将患者分为高/低风险组,三种lncRNA在高风险组患者中表达更高(热图,图3A),而高风险组的患者预后也更差(图3B),ROC曲线也显示三lncRNA标志对BLCA患者生存期的预测性能较好(图3C)。

在“entire dataset”中也得到与图3类似结论(图4)。

图4. ”entire dataset“中对三lncRNA标志的验证

A图:(数据集:entire dataset) 三lnc标志的风险评分分布、生存状态和热图

B图:(数据集:entire dataset) 高/低风险组的K-M曲线

C图:(数据集:entire dataset) 预测3/5年时生存期的ROC

3. 三lncRNA标志的预后价值与传统临床风险因素无关

表3. (数据集:entire dataset) 各风险因素的单因素和多因素Cox比例风险回归分析

补充表2. (数据集:primary dataset) 各风险因素的单因素和多因素Cox比例风险回归分析

在“entire dataset”以及“primary dataset”中的多因素CPHR均显示三lncRNA可以作为独立预测BLCA患者的预后标志(表3、补充表2)。

图5. 对三lncRNA标志对风险分层分析

A-C图:按TNM分期分析高/低风险患者的总生存期(I期样本量太小,无统计学意义)

D-E图:按年龄分析高/低风险患者的总生存期

随后作者进行风险分层分析,发现该标志对某些亚群的预测效率有限,在TNM分期中,对于II期和III期的患者,高风险组的生存期显著低于低风险组。而对于IV期患者,高/低风险组的生存期没有显著差别(图5A-C)。按年龄进行分层分析时,高低风险组也仅在大于65岁的亚群中有显著差异(图5D-E)。

4. 建立三lncRNA标志和临床风险因素的列线图

单因素与多因素回归分析显示,TNM分期和年龄等临床风险因素仍然是BLCA患者重要的预测因素(表3,补充表2),因此作者将之与三lncRNA标志结合,开发出一种有效的定量预测总生存期的方法。

图6. 列线图预测BLCA患者3/5年总生存期

A图:用于预测总生存期的列线图

B图:(数据集:entire dataset) 用列线图预测3年总生存期的校准图

C图:(数据集:entire dataset) 用列线图预测5年总生存期的校准图

D图:(数据集:primary dataset) 用列线图预测3年总生存期的校准图

E图:(数据集:primary dataset) 用列线图预测5年总生存期的校准图

  • 虚线代表完美预测,红线代表预测性能

作者开发出了一个列线图,它基于三lncRNA标志并综合了年龄与TNM分期两个临床风险因素(图6A)。随后使用一致性指数(C指数)和校准图来评估预后列线图的识别和校准能力,结果显示由列线图确定的概率与实际概率非常接近(图6B-E)。

5. 列线图以及其单个因素的生存预测能力

图7. 各因素的预后价值

A图:(数据集:entire dataset) 列线图预测总生存期的ROC曲线

B图:(数据集:primary dataset) 列线图预测总生存期的ROC曲线

C图:三lncRNA标志与单个lncRNA预测总生存期的ROC曲线

D图:列线图与其他单个因素预测总生存期的ROC曲线

为了比较不同预后因素的预测敏感性和特异性,作者比较了各个因素预测预后的ROC曲线。结果显示单个lncRNA标志的预测能力弱于三lncRNA标志(图7C),而三lncRNA标志又弱于TNM分期,但列线图可以很好地整合三个因素的优点,进一步提高对BLCA患者的预测效率(图7D)。

6. 三lncRNA标志的生物学功能

随后作者对与三lncRNA标志共表达的mRNA进行GO分析以及KEGG分析,以确定其在BLCA发生发展中的潜在作用。

图8. 三lncRNA标志的功能富集分析

A图:GO富集分析

B图:KEGG富集分析

GO分析显示其与糖胺聚糖结合、细胞外基质结合和细胞外结构组织相关(图8A),KEGG分析中也发现了类似的结果(图8B),说明三lncRNA标志主要影响细胞外基质,可能与细胞的黏附与迁移相关。

7. RNF144A-AS1在体外促进BLCA细胞迁移和侵袭

补充表4. 三个lncRNA的简要信息

为了进一步探究具体机制,作者选择共表达mRNA最多(175个,见补充表4)的RNF144A-AS1进行分析。

图9. RNF144A-AS1在体外促进膀胱癌细胞的侵袭和迁移

A图:(数据来源:TCGA) RNF144A-AS1在正常细胞以及肿瘤细胞的表达情况

B图:RNF144A-AS1在不同细胞系中的表达情况

  • 正常尿上皮细胞系:SV-HUC

  • BLCA细胞系:5637、T24、J82

C图:(细胞系:5637、T24) 实时定量PCR分析siRNA的沉默效率

D图:(细胞系:5637、T24) Transwell实验,检测肿瘤细胞迁移和侵袭能力

E-F图:(细胞系:5637、T24) 创伤愈合实验,检测肿瘤细胞迁移能力

G图:(细胞系:5637、T24) WB实验,检测上皮-间质转化(EMT)标志物

补充图3. (来自山大第二医院的样本) 27个BLCA患者与正常患者组织中三种lncRNA的表达情况

作者通过TCGA数据库(图9A)和27个患者组织标本(补充图3A),证实BLCA组织中的RNF144A-AS1表达显著高于正常膀胱组织。而在不同的BLCA细胞系中RNF144A-AS1的表达情况不尽相同(图9B),在5637、T24细胞系中RNF144A-AS1表达显著高于正常细胞系,而J82细胞系中RNF144A-AS1表达情况与正常细胞系无明显差异,因此作者随后选择5637、T24细胞系进行研究。

作者首先确认siRNA沉默RNF144A-AS1的效率(图9C),随后进行Transwell(图9D)和创伤愈合实验(图9E-F),证实沉默RNF144A-AS1的表达会抑制细胞的迁移和侵袭能力。而EMT是肿瘤侵袭转移的关键过程,因此作者随后将RNF144A-AS1与EMT相联系,测定了siRNA处理的细胞中EMT蛋白标志物的表达(图9G),结果显示上皮标志物增加,而间充质标志物减少,说明RNF144A-AS1促进了BLCA细胞的EMT,进而增加了细胞的迁移和侵袭能力。

小结

作者利用TCGA数据库,通过R语言的DESeq2包筛选差异基因,随后进行单因素和多因素Cox回归分析,筛选出与预后显著相关的三lncRNA生物标志物,并基于该标志物的风险评分,结合TNM分期和年龄,构建了一个可有效、定量地判断患者预后生存期的列线图,具有重大的临床意义。随后作者也探讨了该标志物中各lncRNA的生物学功能,其中RNF144A-AS1可以通过促进膀胱癌细胞的上皮-间质转化,增加肿瘤细胞的迁移和侵袭能力,具有较大的研究价值。

(0)

相关推荐