【1133.】时间依赖ROC(timeROC)
(谨以此文献给中医统计界老大哥申杰教授,感谢申哥多年来对松哥统计的关心与支持!)
一谈到ROC曲线,大家本能的就会想到诊断试验,就会想到如何去寻找诊断界值(cut off point)。
其实ROC曲线还可以用于模型效果的评价,就是常说的C-Index;同时还有一种用法,就是根据二分类结局为标准,对连续性自变量进行ROC曲线,就可以将连续性或者等级的自变量X进行二分类分组。
如上所述,松哥相信大家都没有问题,然而,当我们研究的是生存数据,研究结局不仅仅是二分类结局,还有时间数据和删失数据的时候,我们就没法轻易获得ROC曲线所要的二分类结局标准。
于是timeROC就粉墨登场了!
原文表述
时间依赖性ROC曲线有(1) cumulative/dynamic(C/D)、(2) incident/dynamic(I/D)和(3) incident/static(I/S)三种定义,其中cumulative/dynamic(C/D)是比较适合用于生存分析的定义,也是当前大多数研究使用的方法。
cumulative/dynamic(C/D)中cumulative是指Cumulative sensitivity,dynamic是指dynamic specificity。对于任意时间t,每一个个体会按照其在时间t的状态被划分到病例组或对照组。在cumulative/dynamic中,如果一个个体在时间0和时间t之间发病,那么其会被划分到病例组(图中A、B和E);如果一个个体在时间0和时间t之间没有发病,那么其会被划分到病例组(图中C、D和F)。
###松哥整理的代码如下:
###timeROC
install.packages("survivalROC")
library(survivalROC)
data(mayo)
head(mayo)
mayo
cutoff <- 365
Mayo4.1= survivalROC(Stime=mayo$time, status=mayo$censor, marker = mayo$mayoscore4, predict.time = cutoff, method="KM")
plot(Mayo4.1$FP, Mayo4.1$TP, type="l", xlim=c(0,1), ylim=c(0,1), xlab=paste( "FP", "\n", "AUC = ",round(Mayo4.2$AUC,3)), ylab="TP", main="Mayoscore 4, Method = KM \n Year = 1")
#加上对角线
abline(0,1)
cut.op2=Mayo4.1$cut.values[which.max(Mayo4.1$TP-Mayo4.1$FP)]
cut.op2
#help("survivalROC")
#5years
cutoff <- 1825
Mayo4.2= survivalROC(Stime=mayo$time, status=mayo$censor, marker = mayo$mayoscore4, predict.time = cutoff, method="KM")
plot(Mayo4.2$FP, Mayo4.2$TP, type="l", xlim=c(0,1), ylim=c(0,1), xlab=paste( "FP", "\n", "AUC = ",round(Mayo4.2$AUC,3)), ylab="TP", main="Mayoscore 4, Method = KM \n Year = 1")
#加上对角线
abline(0,1)
cut.op2=Mayo4.2$cut.values[which.max(Mayo4.2$TP-Mayo4.2$FP)]
cut.op2
---统计思维与理论系列---
【1031.】没有比较就没有伤害,让咱们互相伤害吧,教你4大类统计伤害方法
【1130.】回归建模先单后多法,到底该不该保留无意义变量,理不辨不明
【1128.】logistic与Cox回归的三次样条回归实现
【1126.】R语言实现基于多重插补的广义模型
【1125.】终结了,干预前后数值变量,到底该如何分析与制表
【1124.】那些委托第三方进行论文代写代发,要耗子尾汁了哦!
【1120.】这种错误非常隐蔽,看《中国妇幼保健》上这篇文章就错了,而且还。。。
【1115.】PCA、PLS-DA、OPLS-DA到底啥关系?
【1113.】医学论文中常用回归分析方法的审核要点[松哥荐读]及对策
【1105.】统计问诊:松哥为什么我回归模型无法计算可信区间
[1103.]CNKI升级了,即使撤稿也还能下载,如此留下痕迹,侥幸者要注意啦!
【1090.】中英文期刊分类(SCI分区和中文核心),一文秒懂!
【1086.】为啥20分以上SCI论文如此钟情P-interaction!
【1084.】哎呦妈呀!几何均数还有标准差呀?书中从来没说过呀!
【1075.】很有意思的一个统计问题,并发症到底该如何分析?
【1072.】单因素Logistic回归变量筛选,你还在用表表达,看看人家如何可视化的,审稿人看了能不开心吗?
【1070.】性别和吸烟是专业公认的危险因素,为啥多因素分析性别没意义了?
【1061.】这篇SCI的诊断试验结果看不懂,他到底是咋比的
【1055.】单因素是危险因素,多因素却保护因素了,想逆天吗?
【1054.】这种文章统计套路您一定要学,不管你什么专业通杀
【1052.】同一肝癌患者,同时接受CT、超声和磁共振,如何分析?
【1050.】知道两组数据的样本量均数标准差,怎么算合并统计量呢?
【1049.】meta分析软件Revman5.3卡死解决方案
【1047.】两因素方差分析,如何判断哪个因素对结果影响较大?
【1044.】松哥为啥我318样本量统计分析出来确实400样本量?
【1038.】SCI论文中Logistic回归模型“门当户对”原则,松哥心得推荐给您
【1036.】Logistic回归文章的SCI审稿人意见解读
【1034.】正态分布的3个基因密码,聆听大自然心跳的代码!
【1033.】生存分析K-M法与COX回归结论不一致怎么办?
【1031.】没有比较就没有伤害,让咱们互相伤害吧,教你4大类统计伤害方法
【1022.】听完四个小故事,你就明白主成分分析是啥意思了!
【1021.】方差分析P>0.05,两两比较LSD法P<0.05,这可咋整?
【1017.】倾向性评分后数据,应该采用配对设计还是成组设计?
【1009】P<0.05也别理直气壮,统计也会犯错,还分犯I类和II类错误?
【1008】文章鉴析:这篇文章或许有10处不适!
【1007】R×C卡方的Fisher确切概率法为什么会有卡方值
【1002】连续变量变成等级变量后,原来有意义的变量变得没意义了?
【1001】SCI论文中的P for trend是什么鬼?为什么高分文章经常采用呢
------------------------------