ROC曲线与AUC面积、Gini系数、KS值 之间关系

 

 

P-R曲线是分别将查准率Precision作为纵坐标,查全率Recall(召回率)作为横坐标作的图。

 

ROC曲线、AUC面积、Gini系数、KS值 都是基于两个重要的指标真阳率TPR(又叫查全率或召回率)假阳率FPR(误诊率)得来的。

其中AUC面积、Gini系数是进一步在ROC曲线基础上得到的。

ROC曲线

 

ROC曲线是指受试者工作特征曲线/接收器操作特性曲线(receiver operating characteristic curve),是反应敏感性和特异性连续变量的综合指标,利用构图法揭示敏感性和 特异性的相互关系,它通过将连续变量设定出多个不同的临界值,从而计算出一系列敏感性和特异性,再以敏感性为纵坐标,特异性为横坐标绘制成曲线,曲线下的面积(AUC)越大,诊断准确性越高。最靠近坐标图左上方的点为敏感性和特异性均较高的临界值。

对于一个二分问题来说,会出现以下四种情况。

         
         
         
         
         

 

 

TP(True Positive): 预测为1,真实为1,正例辨出——>真阳性

TN(True Negative):预测为0,真实为0,负例辨出——>真阴性

FN(False Negative): 预测为0,真实为1,正例遗漏——>假阴性

FP(False Positive): 预测为1,真实为0,负例遗漏——>假阳性

 ROC曲线与AUC面积、Gini系数、KS值 之间关系

 ROC曲线与AUC面积、Gini系数、KS值 之间关系

 值得注意的是:所有预测为1阳性的样本 =召回+误诊

 ROC曲线与AUC面积、Gini系数、KS值 之间关系

 

 

 

AUC面积

 

 

KS值

 

 

Gini系数

 

 

 

 

【参考】

【1】如何向门外汉讲解ks值(风控模型术语)?

 

 

上一篇:分类模型性能的评判方法-ROC分析


下一篇:混淆矩阵、精度、召回率、ROC、AUC