Woe公式如下:
woe反映的是在自变量每个分组下违约用户对正常用户占比和总体中违约用户对正常用户占比之间的差异。
IV公式如下:
IV衡量的是某一个变量的信息量,相当于是自变量woe值的一个加权求和,其值的大小决定了自变量对于目标变量的影响程度;从另一个角度来看的话,IV公式与信息熵的公式极其相似。
Gini的计算公式:
Gini指数最早应用在经济学中,主要用来衡量收入分配公平度的指标。在决策树算CART算法中用gini指数来衡量数据的不纯度或者不确定性,同时用gini指数来决定类别变量的最优二分值得切分问题。运用在评分模型中它也是表征评分模型的区分能力。
gini区间:
(
针对评分卡集来说,申请评分卡集的通识标准:
1) Gini<0.3,模型不太能接受;
2) 0.3<=Gini<0.35,模型区分能力一般,模型有优化空间;
3) 0.35<=Gini<=0.5,模型区分能力比较满意;
4) Gini>0.5,Gini越高越有过拟的可能性;
行为评分卡集的通史标准:
1) Gini可能会超过0.8;
2) Gini<0.6,可能模型有问题。
)