【金融申请评分卡】目标变量界定

一、目标变量是什么?

目标变量就是假定申请客户的好坏,逻辑回归公式里的Y,先来看下逻辑回归公式

y=11+ez

z=a1x1+a2x2++anxn+b

其中
y=11+ez

称为sigmoid函数,它的函数图像如下,
【金融申请评分卡】目标变量界定
我们可以看到,通过sigmoid函数输出的y介于(0,1)之间,这样就表明了数据属于某一类别的概率,例如:

假定Y定义为申请客户为好客户还是坏客户,也就是历史数据非0(好客户)即1(坏客户),通过测算业务放款收益损失我们找到了一个公司可接受的逾期率P

y小于p,则说明预测客户有更大的概率属于好客户;
y大于p,则说明预测客户有更大的概率属于坏客户;

当然实际情况好坏客户的划分并没有这么简单,单单是收益损失测算就需要考虑综合费率、资金成本等较多维度。

二、目标变量的界定

对于评分卡目标变量Y的界定,我们主要从Roll Rate和Vintage来观察分析,重点需要考虑三个方面
1) 逾期流转比例
2) 观察期和表现期
3) 样本容量

先分析Roll rate
【金融申请评分卡】目标变量界定
Roll Rate的定义为在当前催收水平下不同逾期天数转化为坏账的概率。从Roll Rate我们看到2017年开始放款,M0 to M1的流转率约为7.8%,M3 to M4的流转率为100%,也就是说,处于M3逾期阶段内的客户基本很难催收,逾期天数大于60天的客户基本为坏客户了。

再分析Vintage
【金融申请评分卡】目标变量界定
Vintage可以关注如下几个方面:

1) 观察每月审批通过客户后第N个月的逾期比率,对比每月波动,通常波动与审批策略调整有关,此波动在数据准备阶段的样本抽样过程需要关注;

2) 逾期分布,集中在通过后的前三个月说明审批的策略有待改进,超过三个月之后才慢慢增加,说明贷中的管理有待提高;

3) 确定逾期率在经历第N期趋于稳定;

从上图Vintage分析,每月放款逾期M2+以上的剩余本金逾期率基本在MOB=8期时趋于稳定,如果我们的放款时间累积比较长,样本表现期可以覆盖到8期,那么就可以界定样本目标变量为在8期内(对于银行往往表现期>8;消费金融<8)逾期天数大于60天的客户为坏客户,也就是Y=1;如果样本的表现期不够8期,那我们就要再综合考虑流转率和帐龄,重新定义满足样本表现期的逾期天数。

总结一句话,变量界定多考虑,看完流转看帐龄。

更多金融风控知识,请关注【金融科技应用学苑】公众号