灵敏性与特异性(转)
在科学研究中,常常听到人们谈到两个相关的概念——灵敏性(sensitivity,Se)和特异性(specificity,Sp)。许多人大概知道它们是用来衡量分类结果好坏的指标,但是对它们的定义和确切含义不很清楚。下面通过一个简单的例子帮助大家把它们轻松搞定。
假如我们有一个由25个男性和75个女性组成的人群,其中有些人由于自然长相或打扮化妆等原因使得其性别判断不太容易,特别是对于一个只有3岁的小孩子Jack来说。Jack正确地识别出25个男性中的20个,但是他也把10个女性误判为男性,那么他在性别判断方面的能力该如何评估呢?Se、Sp就是评估Jack这一能力的两个指标。
首先我们设定这100个人构成一个集合S,其大小为|S|=100。我们的目的是把其中的男性(阳性,positive,P)和女性(阴性,Negative,N)区别开来。因为我们实现已经知道有25个男性,我们把该子集叫做已知阳性集(Known Positive),标记为SKP,大小为|SKP|=25,那么已知阴性集(Known Negative)则为SKN,|SKN|=75。Jack所识别的30个男性构成了检测的阳性子集SP,|SP|=30,其中20个为真阳性(True Positive),STP = SKP∩SP,|STP|=20。那么我们定义Se=|STP|/|SKP|。Jack的Se=20/25=80%。这一指标表明Jack把80%的阳性个体正确地识别出来了。但是他也错误地把一些阴性个体识别为阳性,有可能他很灵敏但是还不够特异,那么Sp是怎么定义的呢?对于Jack来说,|SN|=80,其中真正的阴性从图1中可以看出为STN=SKN∩SN,|STN| = 65。我们定义特异性Sp = |STN|/|SKN|=65/75=60%。
在明确了Se和Sp的定义之后,我们很快可以看出Jack在性别方面的判断能力高于正常,而其他孩子则有的比他更好(super Jack),有的则比他更差(dummy Jack)。(Han CS)
附图:
图1:普通的Jack的Se与Sp。|S| = 100,|SKP| = 25,|SKN| = 75,|SP| = 30,|SN| = 70,STP= SKP∩SP,|STP|=20, STN=SKN∩SN,|STN| = 65, Se=|STP|/|SKP|=20/25=80%, Sp = |STN|/|SKN|=65/75=60%。
图 2:Super Jack不但正确地鉴别出来所有的阳性,也正确地鉴别出来了所有的阴性结果。Se = 1, Sp = 1。
3:dummy Jack:把所有的已知阴性当成阳性结果,且把所有已知阳性当成阴性结果。Se = Sp = 0。
图
4:sensitive Jack:把所有的结果都当作阳性。Se = 1, Sp = 0。
图
5: Specific Jack:把所有的样本都当作阴性。Se = 0, Sp = 1。
图
(1)灵敏性,即病人中得出阳性检测的样本占病人总数的百分比;
(2)特异性,即健康人中得出阴性检测的样本占健康人总数的百分比;
(3)阳性预测值,即得出阳性检测的样本总数中,病人样本占阳性检测样本总数的百分比;
(4)阴性预测值,即得出阴性检测的样本总数中,正常人样本占阴性检测样本总数的百分比。