KS值和KS曲线

KS(Kolmogorov-Smirnov)：KS用于模型风险区分能力进行评估，指标衡量的是好坏样本累计分部之间的差值。
好坏样本累计差异越大，KS指标越大，那么模型的风险
](https://blog.****.net/sscc_learning/article/details/86707005)
thon的k-s值计算KS曲线的绘制
做评分卡模型时（假设有多个自变量，因变量即是否违约。）通常需要筛选变量。

k-s值的作用类似于AUC,它期初是用来评价模型（变量）对是否违约事件的区分程度的。

KS值和KS曲线
在衡量模型效果时，对评分卡或者机器学习模型给出的违约概率和y值计算ks值，给出模型效果来确定模型的好坏（一般0.3左右可以使用，0.4以上模型效果较高，超过0.7，可能模型有问题，这时候需要去debug一下是不是出现了特征信息泄露以及一些其他的问题）。
**注意：对名义变量不适合用k-s值。一下证明了变量值的排序影响最终的ks值：
KS值和KS曲线
**为什么模型评估不用IV，或者选取变量的时候不用KS
**回答：****变量一般不是单调的，如果使用ks, 变量不单调会对ks值有较大影响，掩盖特征的信息价值。而ks是反映了趋势单调性信息的，模型的话出来的概率分要求单调，所以用ks的话更合适一些，用iv也可以，只不过用iv是将分数做变量来评估，而ks则可以对风控策略提供参考。具体的可以从ks和iv计算公式上去看，拿个例子更清楚些

相关推荐