Modeler玩转数据挖掘——保险公司商品关联与推荐分析

保险公司在运营过程中保存了很多交易明细数据,根据客户购买保险商品的记录,可以分析保险商品购买之间的关联,从而为公司提供合理的建议。

首先在Modeler 数据流中导入原始数据

Modeler玩转数据挖掘——保险公司商品关联与推荐分析

可以先预览一下原始数据的结构

Modeler玩转数据挖掘——保险公司商品关联与推荐分析

接着引入一个“类型”节点,将“商品”字段设为“名义”

Modeler玩转数据挖掘——保险公司商品关联与推荐分析

Modeler玩转数据挖掘——保险公司商品关联与推荐分析

保险公司对顾客购买保险商品的记录是按照每个顾客购买的商品条目来记录数据的,为了进行关联分析,需要对这种数据结构进行调整。我们把数据变为每行代表一个顾客的购买行为,在每一行中记录该顾客在各保险商品的购买情况,可以用T表示顾客购买了该保险商品,F表示顾客没有购买该保险商品。

引入一个“设为标志”节点,将“商品”字段中的所有取值设为新的字段

Modeler玩转数据挖掘——保险公司商品关联与推荐分析

Modeler玩转数据挖掘——保险公司商品关联与推荐分析

接入一个“过滤”节点,重命名一下新创建的字段

Modeler玩转数据挖掘——保险公司商品关联与推荐分析

Modeler玩转数据挖掘——保险公司商品关联与推荐分析

以上是将原始数据整理为适合做关联分析的数据格式,在接入关联分析模型之前,需要将每个标志字段的角色设为“两者”

接入一个“类型”节点

Modeler玩转数据挖掘——保险公司商品关联与推荐分析

Modeler玩转数据挖掘——保险公司商品关联与推荐分析

ok,所有数据预处理完毕,下面接入关联分析模型,这里使用Apriori算法,最低条件支持度为10,最小规则置信度为80%,最大前项数为5,这些参数也可以自己调整

Modeler玩转数据挖掘——保险公司商品关联与推荐分析

Modeler玩转数据挖掘——保险公司商品关联与推荐分析

现在所有流程设置完毕,点击运行,会得到一个小钻石节点,这就是关联分析的结果

Modeler玩转数据挖掘——保险公司商品关联与推荐分析

Modeler玩转数据挖掘——保险公司商品关联与推荐分析

根据结果可以得出三条关联规则:

{医疗保险,终身寿险}---->{定期寿险}

{医疗保险,定期寿险}---->{终身寿险}

{定期寿险,终身寿险}---->{医疗保险}