生存分析哪家强?
欢迎来到医科研,这里是白介素2的读书笔记,跟我一起聊临床与科研的故事, 生物医学数据挖掘,R语言,TCGA、GEO,SEER数据挖掘。
.
基因生存分析哪家强?
白介素2
生存分析方法的比较
鉴定患者生存的遗传生物标志物是大规模癌症概况研究的主要目标。利用基因表达数据预测患者肿瘤的结局,开发生物标记物。随着基因组技术的发展,多种数据类型可以用作生物标志物;对于分类变量,例如基因的突变状态,生物标志物的鉴定可以预测存活时间很简单。但是,对于像基因表达这样的连续变量,不同的方法会产生高度可变的结果。
由Drexel大学研究人员领导的团队研究了八种专门处理连续数据的方法的性能。
Cox Regression method
K-means聚类
Kaplan-Scan Splitting
Distribution-based splitting
Quantile-based Splitting
C指数
D指数
将这八种方法应用于来自 TCGA 的四个RNA测序(RNA-seq)数据集。
通过将每个数据集分为两组并比较结果的重叠性来评估八种方法的可靠性。从文献中已针对特定肿瘤类型鉴定出的基因集用作阳性对照,以使用 ROC曲线 评估每种生物标志物的准确性。用人为生成的RNA-Seq数据测试这些方法在固定水平的基因表达噪声下的鲁棒性。这些结果表明,基于二分法的方法往往性能始终不佳,而C指数,D指数和k均值在大多数情况下表现良好。总体而言,基于准确性,可靠性和鲁棒性的测试,Cox回归方法的性能最强。
参考文献
Raman P, Zimmerman S, Rathi KS, de Torrenté L, Sarmady M, Wu C, Leipzig J, Taylor DM, Tozeren A, Mar JC. (2019) A comparison of survival analysis methods for cancer gene expression RNA-Sequencing data. Cancer Genet 235-236:1-12. [abstract])