人工智能_数据分析_信号_心理学_生物学等重要术语: ROC

在信号检测理论中，接收者操作特征曲线(receiver operating characteristic curve，或者叫ROC曲线)是坐标图式的分析工具，用于 (1) 选择最佳的信号侦测模型、舍弃次佳的模型。 (2) 在同一模型中设定最佳阈值。

在做决策时，ROC分析能不受成本／效益的影响，给出客观中立的建议。

ROC曲线首先是由二战中的电子工程师和雷达工程师发明的，用来侦测战场上的敌军载具(飞机、船舰)，也就是信号检测理论。之后很快就被引入了心理学来进行信号的知觉检测。数十年来，ROC分析被用于医学、无线电、生物学、犯罪心理学领域中，而且最近在机器学习(machine learning)和数据挖掘(data mining)领域也得到了很好的发展。

术语

阳性 (P, positive)
阴性 (N, Negative)
真阳性 (TP, true positive) 正确的肯定。又称：命中 (hit)
真阴性 (TN, true negative) 正确的否定。又称：正确拒绝 (correct rejection)
伪阳性 (FP, false positive) 错误的肯定，又称：假警报 (false alarm)，第一型错误
伪阴性 (FN, false negative) 错误的否定，又称：未命中 (miss)，第二型错误
真阳性率 (TPR, true positive rate) 又称：命中率 (hit rate)、敏感度(sensitivity)
TPR = TP / P = TP / (TP+FN)
伪阳性率(FPR, false positive rate) 又称：错误命中率，假警报率 (false alarm rate) FPR = FP / N = FP / (FP + TN)
准确度 (ACC, accuracy) ACC = (TP + TN) / (P + N) 即：(真阳性+真阴性) / 总样本数
真阴性率 (TNR) 又称：特异度 (SPC, specificity) SPC = TN / N = TN / (FP + TN) = 1 - FPR
阳性预测值 (PPV) PPV = TP / (TP + FP)
阴性预测值 (NPV) NPV = TN / (TN + FN) 假发现率 (FDR) FDR = FP / (FP + TP)

基本概念

分类模型(又称分类器，或诊断)将实例映射到特定类。ROC分析的是二元分类模型，也就是输出结果只有两种类别的模型，例如：(阳性/阴性) (有病/没病) (垃圾邮件/非垃圾邮件) (敌军/非敌军)。

当讯号侦测(或变量测量)的结果是连续值时，类与类的边界必须用阈值来界定。举例来说，用血压值来检测一个人是否有高血压，测出的血压值是连续的实数（从0~200都有可能），以收缩压140／舒张压90为阈值，阈值以上便诊断为有高血压，阈值未满者诊断为无高血压。二元分类模型的个案预测有四种结局：

真阳性(TP)：诊断为有，实际上也有高血压。

伪阳性（FP）：诊断为有，实际却没有高血压。

真阴性（TN）：诊断为没有，实际上也没有高血压。

伪阴性（FN）：诊断为没有，实际却有高血压。

这四种结局可以画成2 × 2的混淆矩阵

图片.png

ROC空间

ROC空间将伪阳性率(FPR)定义为 X 轴，真阳性率(TPR)定义为 Y 轴。

给定二元分类模型和它的阈值，就能从所有样本的(阳性/阴性)真实值和预测值计算出(X=FPR, Y=TPR) 座标点。

从 (0, 0) 到 (1,1) 的对角线将ROC空间划分为左上/右下两个区域，在这条线的以上的点代表了一个好的分类结果(胜过随机分类)，而在这条线以下的点代表了差的分类结果(劣于随机分类)。

完美的预测是在左上角的点，在ROC空间座标 (0,1)点，X=0 代表着没有伪阳性，Y=1 代表着没有伪阴性(所有的阳性都是真阳性)；也就是说，不管分类器输出结果是阳性或阴性，都是100%正确。一个随机的预测会得到位于从 (0, 0) 到 (1, 1) 对角线(也叫无识别率线)上的一个点；最直观的随机预测的例子就是抛硬币。

让我们来看在实际有100个阳性和100个阴性的案例时，四种预测方法(可能是四种分类器，或是同一分类器的四种阈值设定)的结果差异：

图片.png

将这4种结果画在ROC空间里：

点与随机猜测线的距离，是预测力的指标：离左上角越近的点预测(诊断)准确率越高。离右下角越近的点，预测越不准。

在A、B、C三者当中，最好的结果是A方法。

B方法的结果位于随机猜测线(对角线)上，在例子中我们可以看到B的准确度(ACC，定义见前面表格)是50%。

C虽然预测准确度最差，甚至劣于随机分类，也就是低于0.5(低于对角线)。然而，当将C以 (0.5, 0.5) 为中点作一个镜像后，C'的结果甚至要比A还要好。这个作镜像的方法，简单说，不管C(或任何ROC点低于对角线的情况)预测了什么，就做相反的结论。

ROC曲线

上述ROC空间里的单点，是给定分类模型且给定阈值后得出的。但同一个二元分类模型的阈值可能设定为高或低，每种阈值的设定会得出不同的FPR和TPR。

将同一模型每个阈值的(FPR, TPR)座标都画在ROC空间里，就成为特定模型的ROC曲线。

例如右图，人体的血液蛋白浓度是呈正态分布的连续变数，病人的分布是红色，平均值为A g/dL，健康人的分布是蓝色，平均值是C g/dL。健康检查会测量血液样本中的某种蛋白质浓度，达到某个值(阈值，threshold)以上诊断为有疾病征兆。研究者可以调整阈值的高低(将左上图的B垂直线往左或右移动)，便会得出不同的伪阳性率与真阳性率，总之即得出不同的预测准确率。

由于每个不同的分类器(诊断工具、侦测工具)有各自的测量标准和测量值的单位(标示为：“健康人－病人分布图”的横轴)，所以不同分类器的“健康人－病人分布图”都长得不一样。
比较不同分类器时，ROC曲线的实际形状，便视两个实际分布的重叠范围而定，没有规律可循。
但在同一个分类器之内，阈值的不同设定对ROC曲线的影响，仍有一些规律可循：

当阈值设定为最高时，亦即所有样本都被预测为阴性，没有样本被预测为阳性，此时在伪阳性率 FPR = FP / ( FP + TN ) 算式中的 FP = 0，所以 FPR = 0%。同时在真阳性率(TPR)算式中， TPR = TP / ( TP + FN ) 算式中的 TP = 0，所以 TPR = 0%

→ 当阈值设定为最高时，必得出ROC座标系左下角的点 (0, 0)。

当阈值设定为最低时，亦即所有样本都被预测为阳性，没有样本被预测为阴性，此时在伪阳性率FPR = FP / ( FP + TN ) 算式中的 TN = 0，所以 FPR = 100%。同时在真阳性率 TPR = TP / ( TP + FN ) 算式中的 FN = 0，所以 TPR=100%

→ 当阈值设定为最低时，必得出ROC座标系右上角的点 (1, 1)。

因为TP、FP、TN、FN都是累积次数，TN和FN随着阈值调低而减少(或持平)，TP和FP随着阈值调低而增加(或持平)，所以FPR和TPR皆必随着阈值调低而增加(或持平)。

→ 随着阈值调低，ROC点往右上(或右／或上)移动，或不动；但绝不会往左下(或左／或下)移动。

图片.png

曲线下面积(AUC)

例示三种AUC值(曲线下面积)

在比较不同的分类模型时，可以将每个模型的ROC曲线都画出来，比较曲线下面积做为模型优劣的指标。

意义

ROC曲线下方的面积(英语：Area under the Curve of ROC (AUC ROC))，其意义是：

因为是在1x1的方格里求面积，AUC必在0~1之间。

假设阈值以上是阳性，以下是阴性；

若随机抽取一个阳性样本和一个阴性样本，分类器正确判断阳性样本的值高于阴性样本之机率。

简单说：AUC值越大的分类器，正确率越高。

从AUC判断分类器(预测模型)优劣的标准：

AUC = 1，是完美分类器，采用这个预测模型时，存在至少一个阈值能得出完美预测。绝大多数预测的场合，不存在完美分类器。

0.5 < AUC < 1，优于随机猜测。这个分类器(模型)妥善设定阈值的话，能有预测价值。

AUC = 0.5，跟随机猜测一样(例：丢铜板)，模型没有预测价值。

AUC < 0.5，比随机猜测还差；但只要总是反预测而行，就优于随机猜测。

计算

AUC的计算有两种方式，都是以逼近法求近似值。

梯形法

梯形法(英语：trapezoid method)：简单地将每个相邻的点以直线连接，计算连线下方的总面积。因为每一线段下方都是一个梯形，所以叫梯形法。

优点：简单，所以常用。

缺点：倾向于低估AUC。

ROC AUCH法

潜在问题

AUC of ROC是机器学习的社群最常使用来比较不同模型优劣的方法。然而近来这个做法开始受到质疑，因为有些机器学习的研究指出，AUC的噪声太多，并且很常求不出可信又有效的AUC值(此时便不能保证AUC传达本节开头所述之意义)，使得AUC在模型比较时产生的问题比解释的问题更多。

图片.png

分析软件

所有常用于统计分析的软件(例：SPSS、SAS、SYSTAT、S-Plus、ROCKIT、RscorePlus)都有依据不同阈值自动计算真阳性和伪阳性比率、并依此绘制ROC曲线的功能。

离散分类器(英语：discrete，或称“间断分类器”)，如决策树，产生的是离散的数值或者一个二元标签。应用到实例中，这样的分类器最后只会在ROC空间产生单一的点。而一些其他的分类器，如朴素贝叶斯分类器，逻辑回归或者人工神经网络，产生的是实例属于某一类的可能性，对于这些方法，一个阈值就决定了ROC空间中点的位置。举例来说，如果可能值低于或者等于0.8这个阈值就将其认为是阳性的类，而其他的值被认为是阴性类。这样就可以通过画每一个阈值的ROC点来生成一个生成一条曲线。MedCalc是较好的ROC曲线分析软件。

展开阅读全文

页面更新：2024-05-17

标签：算式阈值座标对角线梯形准确度阴性高血压阳性人工智能生物学样本术语心理学曲线模型信号面积方法数据

1 2 3 4 5

人工智能_数据分析_信号_心理学_生物学等重要术语: ROC

python人工智能机器学习书籍 scikit-learn Cookbook 2nd Edition

性能测试工具Locust和JMeter比较

2分钟搞定美白+清洁？媲美飞利浦的声波震动科技，让刷牙变上瘾

让年轻人趋之若鹜！新派网红“迷你筋膜枪”，靠什么诱惑你？

小米造车并非一时冲动！雷军8年前拜访马斯克，伟大决定蛰伏多年

小米11 Pro：众多黑科技加身，冲击安卓旗舰天花板

跻身互联网造车新贵！“迟到”的小米汽车，或将亲民路线进行到底

小米有品上架硬核户外神器，露营达人竟用它建了一层“小别墅”

男人败家新姿势，小米有品手工枪，10分钟搭建大别墅，媲美博世

轻薄也有大电池？小米11青春版打破行业铁则，引发手机圈大地震

卢伟冰再度击穿行业底价，高通也太宠了！IQOO7：算你狠

华为跌落第二，谁能撑起国产高端手机？资深人士：只有雷军能胜任

国外主播太敢了，顶着压力公开小米新机信息，结果打了苹果的脸

AirPods平替，漫步者这款蓝牙耳机仅凭“降噪”弯道超车？

被忽略的好声音？除了奔驰，德国造“魔性”蓝牙音箱杀入国内圈粉

python人工智能机器学习书籍 scikit-learn Cookbook 2

数据仓库快速入门教程16商业智能简介

数据仓库快速入门教程14数据湖简介

数据仓库快速入门教程17数据挖掘

数据仓库快速入门教程8-OLTP vs OLAP

数据仓库快速入门教程7-MOLAP

敏捷测试开发快速入门教程1什么是敏捷方法论？

软件测试管理快速入门12-使用PDCA模型的测试过程改进

软件工程快速入门教程6- 原型模型

软件测试快速入门4-V模型