KS值和KS曲线

KS(Kolmogorov-Smirnov):KS用于模型风险区分能力进行评估, 指标衡量的是好坏样本累计分部之间的差值。
好坏样本累计差异越大,KS指标越大,那么模型的风险
](https://blog.****.net/sscc_learning/article/details/86707005)
thon的k-s值计算KS曲线的绘制
做评分卡模型时(假设有多个自变量,因变量即是否违约。)通常需要筛选变量。

k-s值的作用类似于AUC,它期初是用来评价模型(变量)对是否违约事件的区分程度的。

KS值和KS曲线
在衡量模型效果时,对评分卡或者机器学习模型给出的违约概率和y值计算ks值,给出模型效果来确定模型的好坏(一般0.3左右可以使用,0.4以上模型效果较高,超过0.7,可能模型有问题,这时候需要去debug一下是不是出现了特征信息泄露以及一些其他的问题)。
**注意:对名义变量不适合用k-s值。一下证明了变量值的排序影响最终的ks值:
KS值和KS曲线
**为什么模型评估不用IV,或者选取变量的时候不用KS
**回答:****变量一般不是单调的,如果使用ks, 变量不单调会对ks值有较大影响,掩盖特征的信息价值。而ks是反映了趋势单调性信息的,模型的话出来的概率分要求单调,所以用ks的话更合适一些,用iv也可以,只不过用iv是将分数做变量来评估,而ks则可以对风控策略提供参考。具体的可以从ks和iv计算公式上去看,拿个例子更清楚些