5+分思路:非编码RNA结合临床预后进行分析
A nomogram combining long non-coding RNA expression profiles and clinical factors predicts survival in patients with bladder cancer通过lncRNA表达谱和临床因素相结合的列线图来预测膀胱癌患者的生存期
一. 研究背景
在对膀胱癌(BLCA)的临床治疗当中,TNM分期以及淋巴结状态往往用于评估BLCA的预后。但该项评估仅仅基于固有的解剖信息,并且由于BLCA的生物学异质性,临床上很难预测疾病的进展,因此需要可靠的生物标志物来预测BLCA患者的预后并指导治疗。
lncRNA通过与核酸、蛋白质和其他大分子结合,发挥精细的调控作用,最终推动肿瘤的发生和转移,是一个巨大的潜在的癌症治疗靶点库。有研究报道lncRNA可以标记肿瘤的进展,甚至预测结果,作者基于此展开对BLCA的研究。
二. 分析流程
三. 结果解读
1. 与BLCA患者总生存期相关的候选lncRNA
图2. 膀胱癌患者的差异表达lncRNA
A图:(数据来源:TCGA) 826个差异表达lncRNA的火山图
B图:(数据来源:TCGA) 826个差异表达lncRNA的热图
补充图1. 膀胱癌患者的差异表达mRNA
作者通过TCGA数据库,比较414例BLCA患者和19例正常人的lncRNA和mRNA表达谱,确定了826个差异表达的lncRNA(DEL,图2);以及1841个差异表达的mRNA(DEM,补充图1)。排除了4例生存资料不足的患者后,作者对DEL进行单因素Cox比例风险回归分析(CPHR,补充表1)以及K-M生存分析(补充图2)。
补充表1. 与总生存期显著相关的候选lncRNA
Cox回归分析显示,11个lncRNA与BLCA患者的总生存期显著相关,其中10个lncRNA(除SMC2-AS1)的危险比(HR)大于1,即其过表达与更短的总生存期相关;而SMC2-AS1的HR<1,其过表达与总生存期增加相关。K-M分析曲线结果与CPHR一致。
补充图2. 与候选lncRNA表达高低相关的K-M曲线
2. 用于生存预测的三lncRNA标志的识别与验证
表1. BLCA患者的临床特征
作者再次排除了34例没有缺少TNM分期和年龄等临床特征数据的患者,随机定义剩下一半患者为”primary dataset“,而整体患者为”entire dataset“,两组间临床特征无显著性差异(表1)。
表2. 三种lncRNA与患者的总体生存期显著相关
为了确定与总生存期相关的最佳lncRNA标志,作者通过多因素CPHR分析,确定了3个lncRNA(表2),并计算其风险评分,风险评分公式为:
其中,Exp为lncRNA的表达值,C为多因素Cox回归分析中相应的系数。
图3. "primary dataset"中对三lncRNA标志的验证
A图:(数据集:primary dataset) 三lnc标志的风险评分分布、生存状态和热图
B图:(数据集:primary dataset) 高/低风险组的K-M曲线
C图:(数据集:primary dataset) 预测3/5年时生存期的ROC
作者根据风险评分的中位数,将患者分为高/低风险组,三种lncRNA在高风险组患者中表达更高(热图,图3A),而高风险组的患者预后也更差(图3B),ROC曲线也显示三lncRNA标志对BLCA患者生存期的预测性能较好(图3C)。
在“entire dataset”中也得到与图3类似结论(图4)。
图4. ”entire dataset“中对三lncRNA标志的验证
A图:(数据集:entire dataset) 三lnc标志的风险评分分布、生存状态和热图
B图:(数据集:entire dataset) 高/低风险组的K-M曲线
C图:(数据集:entire dataset) 预测3/5年时生存期的ROC
3. 三lncRNA标志的预后价值与传统临床风险因素无关
表3. (数据集:entire dataset) 各风险因素的单因素和多因素Cox比例风险回归分析
补充表2. (数据集:primary dataset) 各风险因素的单因素和多因素Cox比例风险回归分析
在“entire dataset”以及“primary dataset”中的多因素CPHR均显示三lncRNA可以作为独立预测BLCA患者的预后标志(表3、补充表2)。
图5. 对三lncRNA标志对风险分层分析
A-C图:按TNM分期分析高/低风险患者的总生存期(I期样本量太小,无统计学意义)
D-E图:按年龄分析高/低风险患者的总生存期
随后作者进行风险分层分析,发现该标志对某些亚群的预测效率有限,在TNM分期中,对于II期和III期的患者,高风险组的生存期显著低于低风险组。而对于IV期患者,高/低风险组的生存期没有显著差别(图5A-C)。按年龄进行分层分析时,高低风险组也仅在大于65岁的亚群中有显著差异(图5D-E)。
4. 建立三lncRNA标志和临床风险因素的列线图
单因素与多因素回归分析显示,TNM分期和年龄等临床风险因素仍然是BLCA患者重要的预测因素(表3,补充表2),因此作者将之与三lncRNA标志结合,开发出一种有效的定量预测总生存期的方法。
图6. 列线图预测BLCA患者3/5年总生存期
A图:用于预测总生存期的列线图
B图:(数据集:entire dataset) 用列线图预测3年总生存期的校准图
C图:(数据集:entire dataset) 用列线图预测5年总生存期的校准图
D图:(数据集:primary dataset) 用列线图预测3年总生存期的校准图
E图:(数据集:primary dataset) 用列线图预测5年总生存期的校准图
虚线代表完美预测,红线代表预测性能
作者开发出了一个列线图,它基于三lncRNA标志并综合了年龄与TNM分期两个临床风险因素(图6A)。随后使用一致性指数(C指数)和校准图来评估预后列线图的识别和校准能力,结果显示由列线图确定的概率与实际概率非常接近(图6B-E)。
5. 列线图以及其单个因素的生存预测能力
图7. 各因素的预后价值
A图:(数据集:entire dataset) 列线图预测总生存期的ROC曲线
B图:(数据集:primary dataset) 列线图预测总生存期的ROC曲线
C图:三lncRNA标志与单个lncRNA预测总生存期的ROC曲线
D图:列线图与其他单个因素预测总生存期的ROC曲线
为了比较不同预后因素的预测敏感性和特异性,作者比较了各个因素预测预后的ROC曲线。结果显示单个lncRNA标志的预测能力弱于三lncRNA标志(图7C),而三lncRNA标志又弱于TNM分期,但列线图可以很好地整合三个因素的优点,进一步提高对BLCA患者的预测效率(图7D)。
6. 三lncRNA标志的生物学功能
随后作者对与三lncRNA标志共表达的mRNA进行GO分析以及KEGG分析,以确定其在BLCA发生发展中的潜在作用。
图8. 三lncRNA标志的功能富集分析
A图:GO富集分析
B图:KEGG富集分析
GO分析显示其与糖胺聚糖结合、细胞外基质结合和细胞外结构组织相关(图8A),KEGG分析中也发现了类似的结果(图8B),说明三lncRNA标志主要影响细胞外基质,可能与细胞的黏附与迁移相关。
7. RNF144A-AS1在体外促进BLCA细胞迁移和侵袭
补充表4. 三个lncRNA的简要信息
为了进一步探究具体机制,作者选择共表达mRNA最多(175个,见补充表4)的RNF144A-AS1进行分析。
图9. RNF144A-AS1在体外促进膀胱癌细胞的侵袭和迁移
A图:(数据来源:TCGA) RNF144A-AS1在正常细胞以及肿瘤细胞的表达情况
B图:RNF144A-AS1在不同细胞系中的表达情况
正常尿上皮细胞系:SV-HUC
BLCA细胞系:5637、T24、J82
C图:(细胞系:5637、T24) 实时定量PCR分析siRNA的沉默效率
D图:(细胞系:5637、T24) Transwell实验,检测肿瘤细胞迁移和侵袭能力
E-F图:(细胞系:5637、T24) 创伤愈合实验,检测肿瘤细胞迁移能力
G图:(细胞系:5637、T24) WB实验,检测上皮-间质转化(EMT)标志物
补充图3. (来自山大第二医院的样本) 27个BLCA患者与正常患者组织中三种lncRNA的表达情况
作者通过TCGA数据库(图9A)和27个患者组织标本(补充图3A),证实BLCA组织中的RNF144A-AS1表达显著高于正常膀胱组织。而在不同的BLCA细胞系中RNF144A-AS1的表达情况不尽相同(图9B),在5637、T24细胞系中RNF144A-AS1表达显著高于正常细胞系,而J82细胞系中RNF144A-AS1表达情况与正常细胞系无明显差异,因此作者随后选择5637、T24细胞系进行研究。
作者首先确认siRNA沉默RNF144A-AS1的效率(图9C),随后进行Transwell(图9D)和创伤愈合实验(图9E-F),证实沉默RNF144A-AS1的表达会抑制细胞的迁移和侵袭能力。而EMT是肿瘤侵袭转移的关键过程,因此作者随后将RNF144A-AS1与EMT相联系,测定了siRNA处理的细胞中EMT蛋白标志物的表达(图9G),结果显示上皮标志物增加,而间充质标志物减少,说明RNF144A-AS1促进了BLCA细胞的EMT,进而增加了细胞的迁移和侵袭能力。
小结
作者利用TCGA数据库,通过R语言的DESeq2包筛选差异基因,随后进行单因素和多因素Cox回归分析,筛选出与预后显著相关的三lncRNA生物标志物,并基于该标志物的风险评分,结合TNM分期和年龄,构建了一个可有效、定量地判断患者预后生存期的列线图,具有重大的临床意义。随后作者也探讨了该标志物中各lncRNA的生物学功能,其中RNF144A-AS1可以通过促进膀胱癌细胞的上皮-间质转化,增加肿瘤细胞的迁移和侵袭能力,具有较大的研究价值。