第Ⅰ、Ⅱ类错误~“火眼金睛”辨真伪

原标题:第Ⅰ、Ⅱ类错误~“火眼金睛”辨真伪

勤俭持家,环保先行!生活垃圾分类是个利国利民的大好事,对于各色“宝贝”您会分类啵?

当然,生活中还有一些"有害垃圾"需要我们练就“火眼金睛”注意识别与处理!

他们好比是爱情婚姻中的“渣男”,亦称“小颗粒男”!

“火眼金睛”的修炼段位决定了你对“小颗粒男”的预测准确率。有这两个概念就懂敏感性SE和特异性SP了,这都是用于衡量我们(预测)是否遇到"渣男"的方法效果哦。

1.我们来考虑两个极端的情况:

第Ⅰ类错误+++

我的判定/预测方法里的“小颗粒男”里面包含了所有的"真渣男"(金标准)个体,想实现这个很简单,就是任何

一个人来咨询婚姻问题,我凉伴鲜都说你老公出轨外面成家生娃了,这会带来什么结果呢???

a.正面的,就是所有的行为不端的臭男人我都可以给你判断出来

b.负面的呢?就是同时一大堆本分规矩踏实过日子的好男人给误判为渣男了!

这么敏感!那你真的是发神经啂~~

第Ⅱ类错误---

我的诊断/预测方法的“老实人”包含了所有的“纯24孝老公”(金标准)个体,一个极端的诊断方法就是任何

一个人来看家庭问题的我都说你老公是老实人没有外道儿,对所有疑似出轨证据都无视或淡化,这回漏掉了很多

的劈腿男银啊~那是掩耳盗铃,按这套路出牌,你铁定是纯正渣男收割机啊!

当然大部分的诊断和预测方法都不会这么极端,核心意思就是我们必须同时考虑我们方法在阳性和阴性(犯第一类错误和第二类错误)两方面的综合表现

画个饼,横轴是金标准的阳性和阴性纵轴是方法的阳性和阴性,我们预测的任何一个个体都会落到以下四个象限中的一个:Confusion matrix混淆矩阵 / Contingency table列联表 (这个表的两种名称)

看清图片,要开车了哦

真阳性:左上格,金标准和预测都为真;真阴性:右下格,金标准和预测都为假;

假阳性:右上格,就是我们的预测结果是假的阳性(预测出来的阳性其实是金标准的阴性);

假阴性:左下格,就是我们的预测结果是假的阴性(预测出来的阴性其实是金标准的阳性);

敏感性sensitivity:顾名思义,就是我们的方法对阳性的敏感度,换句话说就是我给你一堆“火眼金睛”判定为"真渣男"的人,你能判断出多少个来。这个值命名为敏感性还是很形象的。

特异性specificity:顾名思义,就是你的方法能判断出阴性的能力,我给你一堆“火眼金睛”判定为“24k绝世好老公”的人,你会不会误判出一些“小颗粒男”的情况呢。这个命名还是欠缺形象性,叫"准没事儿"更贴切。

FDR(误诊率):常用于多重检验下的p-value矫正;伪发现率,其意义为是 错误拒绝(拒绝真的(原)假设)的个数占所有被拒绝的原假设个数的比例的期望值。就是我的所有预测阳性中有多少是误判的假阳性。使用FDR就是用于控制假阳性的比率(通常为0.05),就是第I类错误嘛。

第一类错误、第二类错误:显然我们的方法里有且仅有两类错误,通常我们先考虑我们预测的阳性结果,里面有多少错误(其实是金标准的阴性),这些错误就是第一类错误,也就是上面的假阳性。在考虑我们预测的阴性结果,里面有多少是假阴性,也就是有多少第二类错误。

False positive rate (FPR):假阳性率,等于1-specificity,1-准没事儿那不就是假阴性吗。

返回搜狐,查看更多

责任编辑:

声明:该文观点仅代表作者本人,搜狐号系信息发布平台,搜狐仅提供信息存储空间服务。
免费获取
今日搜狐热点
今日推荐