ROC:坚韧~倔强的心

原标题:ROC:坚韧~倔强的心

摇滚(Rock and Roll)肉肯肉,灵活大胆和富有激情,起源于20世纪40年代末期的美国,50年代早期开始流行,60~70年形成一股热潮。在那个大国对抗,体系崩塌的动荡年代摇滚乐凭借独有的魅力风靡全球,大师辈出、万丈光芒的黄金时代!

今天介绍的这个是摇滚的表弟,他就是集编曲天赋与演奏才华于一身的ROC曲线~

诊断性试验的常用评价指标中,Se、Sp、+LR和-LR属于稳定指标(那稳定性刚刚滴如tank一般,稳刚!)

Acc相对稳定指标,而PPV和NPV为不稳定的指标(不提也罢~Σ( ° △ °|||)︴)。

小天使的大名叫做~受试者工作特征曲线(receiver operator characteristic curve, ROC曲线),

这个名字源于评价雷达性能而生的,所以小名儿叫:接收者操作特性曲线。

ROC基于SE(sensitivity)和SP(specificity)衍生出来,且只能用于二分类模型的评价

ROC曲线是以真阳TPR(SE)为纵坐标FPR假阳(1-SP)为横坐标绘制的曲线。

诊断模型的其他指标都依赖一个threshold临界值或阈值),单一的界点是有偏颇的。

ROC:每个分类器作出的预测,都是基于一个probability score(机率评分)。一般默认的threshold都是0.5,如果probability>0.5,那么这个sample被模型分成正例了,反之则是反例。

ROC曲线是一系列threshold下的(FPR,TPR)数值点的连线。不同阈值下模型的sensitivity和specificity不同。

  • (0,0):TP=0,FP=0,可以发现该分类器预测所有的样本都为负样本(Negative)
  • (1,1):TN=0,FN=0,可以发现该分类器预测所有的样本都为正样本(Positive)
  • (0,1):FP=0,FN=0,它将所有的样本都正确分类
  • (1,0):TP=0,TN=0,它将所有的样本都错误分类

ROC曲线 检验项目(自变量)一般为连续性变量(各类检查的测值)前篇提过的"拉面"!而非"投钢镚儿"这类离散变量!

ROC曲线的金标准(因变量)一般为生存/死亡~二分类变量阳性/阴性 ~飞机 、飞鸟~正面、反面)。

二、ROC曲线有个鸟用?

1.ROC曲线能很容易地查出:任意界限值时的对疾病的识别能力。

三、ROC曲线的关键点

1.正确选择临界点(cutoff)

1)Se越高,漏诊病例越少;而1-Sp越低,误诊率越少!ROC曲线上两值都取得最好的效果,左上角找!

2)最近左上角那点为最佳临界点(敏感度与特异度都较高,假阳性与假阴性也最少),点上的值即

最佳临界值=约登指数取得最大值的界值(约登指数=敏感度+特异度-1)

2.AUC用于评估试验的诊断价值

AUC(area under the ROC curve, AUC)即ROC曲线下面积,AUC越大越好,提示该分类器效果越好(试验的诊断价值越高)。AUC的意义:分别随机从正负样本集中抽取一个正样本,一个负样本,正样本的预测值大于负样本的概率。Wilcoxon-Mann-Witney Test。

1)AUC≈1.0:最理想的检查指标,天仙姐姐Ἀφροδίτη(Aphrodite),只在神话中;

2)AUC在0.7-0.9之间:试验准确性高,就像白富美高妹~蒙娜丽莎slash;

3)AUC=0.5:试验无诊断价值,等同于蒙~蒙~蒙~就像大傻辛普森

一般来说,AUC达到0.9以上才认为是一个准确性很高的诊断试验,此时的cutoff才有实际意义!~Das Rock!

3.AUC用于比较两种或两种以上诊断性试验的诊断价值。

将各试验的ROC曲线绘制到同一坐标中,靠近左上角的ROC曲线所代表的受试者工作最准确,亦可通过比较各个试验的ROC曲线下的面积(AUC)进行比较,哪一种试验的AUC最大,则哪一种试验的诊断价值最佳。

上面这仨伢子,哪个棉花弹得最好哩!?

"那天是你用一块ROC,蒙住我双眼也蒙住了AUC,你问我看见了Youden么,我说我看见了cutoff~"返回搜狐,查看更多

责任编辑:

声明:该文观点仅代表作者本人,搜狐号系信息发布平台,搜狐仅提供信息存储空间服务。
免费获取
今日搜狐热点
今日推荐