ROC绘制工具介绍

关于ROC曲线,在STATQUEST系列当中讲得十分的明白。所以如果不是很清楚ROC以及曲线下面积(AUC)的介绍的话,可以看一下下面的这个视频

PS: B站之前是有关于这个STATQUEST所有视频的搬运的。但是不清楚后来作者都删除了。所以以下是简单的搬运,感兴趣的可以去想办法去看所有的视频。作者讲的很好的。

以上就是作者对于ROC以及AUC的基本的讲解。对于我们而言,主要还是要了解ROC能干嘛。基本的来说,ROC曲线主要是两个方面的作用

  1. 比较不同诊断方式(模型)之间的好坏:例如在进行一个疾病诊断模型构建的时候,我们会得到多个诊断的模型,比如A+B的诊断模型以及B+C的诊断模型。那么怎么评价两者的好坏的。这个时候就可以使用两者的ROC曲线,然后比较他们的曲线下面积(AUC)就可以

  2. 对一个连续性变量进行分类变量的划分:在进行数据类型转换的时候,我们经常需要把一个连续性变量(比如年龄)变成一个二分类的变量(比如分成 > 30岁和 <=30岁)。这种年龄的划分,不可能是随便划分。我们需要确定怎么划分对于结果是有意义的才行。这个时候就可以使用ROC曲线,来进行划分,我们可以寻找在ROC曲线当中灵敏度和特异度综合起来最好的地方来当作我们划分的cutoff值。

好啦,上面啰嗦了那么多,想必大家应该已经对ROC曲线有了系统的了解,有关ROC的讲解就先介绍到这里。下面给大家介绍一个在线检验诊断效能的工具:ROC Plotter(http://www.rocplot.org/site/index)。该工具利用乳腺癌、卵巢癌及胶质母细胞瘤患者的转录组水平数据同时也支持上传自己的数据进行绘制,将基因表达与治疗效应联系起来。ROC Plotter是第一个用于预测生物标志物的在线转录组水平验证工具。

根据官网地址,主页面如下。目前仅支持乳腺癌、卵巢癌及胶质母细胞瘤3种癌症类型的在线分析。但提供用户数据上传功能,进行在线分析,类似于SPSS。

好啦,话不多说,下面小编就乳腺癌为例,简要介绍一下该数据库的使用方法。

点击ROC Plotter for breast cancer。

”为必须输入选项。这里输入基因TP53(当然,我们可以一次输入多个基因,但是这些基因的ROC曲线并不会出现在一个图上,而是分别做图),以5年无复发生存时间为例。

选项3. Treatment处提供了3种治疗方法及更具体的药物。

选项4. Filters为非必须选项,若要分析全部乳腺癌时可以跳过此选项。如下图所示,此处提供了更为详细的亚组分类。比如我们不想分析所有的乳腺癌,只想看一下HER2阳性的乳腺癌中TP53的诊断效能,那我们这里HER2 status处选择Positive。

点击"Calculate"进行分析,结果如下。

此处AUC为0.506,且P=0.47,说明TP53的诊断效能极差。

Mann-Whitney U检验是基于秩次的非参数检验,此处利用它来确定两组之间基因表达是否存在差异。此处P=0.94,差异无统计学意义。

以上就是这个工具的基本使用过程。另外这个工具也支持上传自己的数据,所以只要是想做类似的ROC的分析,都可以上传数据来进行分析的。

(0)

相关推荐