P-R曲线是分别将查准率Precision作为纵坐标,查全率Recall(召回率)作为横坐标作的图。
ROC曲线、AUC面积、Gini系数、KS值 都是基于两个重要的指标真阳率TPR(又叫查全率或召回率)和假阳率FPR(误诊率)得来的。
其中AUC面积、Gini系数是进一步在ROC曲线基础上得到的。
ROC曲线
ROC曲线是指受试者工作特征曲线/接收器操作特性曲线(receiver operating characteristic curve),是反应敏感性和特异性连续变量的综合指标,利用构图法揭示敏感性和 特异性的相互关系,它通过将连续变量设定出多个不同的临界值,从而计算出一系列敏感性和特异性,再以敏感性为纵坐标,特异性为横坐标绘制成曲线,曲线下的面积(AUC)越大,诊断准确性越高。最靠近坐标图左上方的点为敏感性和特异性均较高的临界值。
对于一个二分问题来说,会出现以下四种情况。
TP(True Positive): 预测为1,真实为1,正例辨出——>真阳性
TN(True Negative):预测为0,真实为0,负例辨出——>真阴性
FN(False Negative): 预测为0,真实为1,正例遗漏——>假阴性
FP(False Positive): 预测为1,真实为0,负例遗漏——>假阳性
值得注意的是:所有预测为1阳性的样本 =召回+误诊
AUC面积
KS值
Gini系数
【参考】