PART 1.1 如何确定建模的Y值

最重要的事情开始都会讲:建模是始终服务于业务的,没有业务的评分卡就没有灵魂

风控建模:如何定义Y值

定义Y
什么样的客户是好客户
什么样的客户是坏客户
我认为是首要的,也就是需要有一个目标,也就是方向要对

简要介绍A B C 卡

A卡(Application scorecard)申请卡:客户授信,预测客户开户后一定时期内违约拖欠的风险概率,有效排除信用不良客户和非目标客户的申请
B卡(Behavior score card)行为卡:在帐户管理期,根据账户历史上所表现出来的各种行为特征来预测该账户未来的信贷表现
C卡(Collection scorecard)催收卡:在帐户管理期,对逾期帐户预测催收策略反应的概率,从而采取相应催收措施

目标变量的界定

  • 观察期的界定是 观察点 表现期 观察期
  • 观察期决定的是选择的变量以及变量的窗口时间 (观察期不宜过长 时间切片 从 7天 到 1 年不等)
  • 表现期决定的是客户的表现情况:好 or 坏
    (好坏的定义需要自己设定)

PART 1.1 如何确定建模的Y值
PART 1.1 如何确定建模的Y值
拿一个例子来讲:

定义一批客群的好坏:我需要用到该客群从授信前一年的数据集,定义的是逾期30天

从上面可以提取关键信息:

1 观察点:授信
2 观察期: 授信前一年
3 表现期:还款到期后30天的具体表现

接下来 划重点,怎么取对目标变量Y进行界定:

1 Roll Rate
2 Vintage
3 Sample (基于数据的表现情况)

Roll Rate的定义为在当前催收水平下不同逾期天数转化为坏账的概率

即:上一个阶段流转到下一个阶段的金额或者比例

Roll Rate2017年开始放款,M0 to M1的流转率约为7.8%,M3 to M4的流转率为100%,处于M3逾期阶段内的客户基本很难催收,逾期天数大于60天的客户基本为坏客户
PART 1.1 如何确定建模的Y值
再分析Vintage
分子是累积的金额/分母是不变的金额 (比如M1 M2)
PART 1.1 如何确定建模的Y值

Vintage关注如下方面:
观察每月审批通过客户后第N个月的逾期比率
逾期分布,集中在通过后的前三个月说明审批的策略有待改进,超过三个月之后才慢慢增加,说明贷中的管理有待提高
确定逾期率在经历第N期趋于稳定
从Vintage分析,每月放款逾期M2+以上剩余本金逾期率基本在MOB=8期时趋于稳定,如果放款时间累积比较长,样本表现期可覆盖到8期,那界定样本目标变量为在8期内(对于银行往往表现期>8;消费金融<8)逾期天数大于60天的客户为坏客户,也就是Y=1;
如样本表现期不够8期,再综合考虑流转率和帐龄,重新定义满足样本表现期逾期天数。

总结一句话,变量界定多考虑,看完流转看帐龄,观察期确定X变量,表现期确定Y变量

针对申请模型来说,表现期就是客户申请通过放款,客户的还款表现
观察期就是客户申请点之前需要纳入观察的行为活动数据的时间,即回溯
表现期一般看vintage,vintage在某个mob达到一个较稳定的坏账率的时候,即可将此mob作为表现期

PART 1.1 如何确定建模的Y值

参考文献:

https://www.zhihu.com/question/51583052/answer/153234607

最重要的事情最后都会讲:建模是始终服务于业务的,没有业务的评分卡就没有灵魂