实战:航空公司客户价值分析

一、 背景与挖掘目标

试图实现以下目标:

(1)借助航空公司数据,对客户进行分类。

(2)对不同类别的客户进行特征分析,比较不同类别客户的价值分析。

(3)对不同价值的客户类别进行个性化服务,制定相应的营销策略。

二、分析方法

使用 LRMFC模型来进行分析

L:

实战:航空公司客户价值分析

三、数据探索

注意观察describe()函数参数变化。

(1)

实战:航空公司客户价值分析

实战:航空公司客户价值分析

实战:航空公司客户价值分析

(2)

实战:航空公司客户价值分析

实战:航空公司客户价值分析

实战:航空公司客户价值分析

实战:航空公司客户价值分析

导出后的Excel文件如下:

实战:航空公司客户价值分析

四、数据预处理

1、数据清洗

由数据探索分析可知,数据中存在缺失值,存在票价最小值为0、平均折扣率为0但飞行公里数却大于0的记录。由于这些记录的数量不多,所以对其进行丢失处理。

PS:在Excel中对

SUM_YR_1
SUM_YR_2
筛选掉空白值时,
SUM_YR_2
有太多值,筛选只能显示前10000个值,所以只能通过自定义筛选的方法来去除空白值。

实战:航空公司客户价值分析

2、属性规约

根据LRFMC模型,选择与该模型相关的6个属性:FFP_DATE、LOAD_TIME、FLIGHT_COUNT、avg_discount、SEG_KM_SUM、LAST_TO_END

实战:航空公司客户价值分析

结果如下:

实战:航空公司客户价值分析

实战:航空公司客户价值分析

3、数据变换

 数据变换是将数据转换成“适当的”形式,以适应挖掘任务和算法的要求。本案例中采用的数据变换方式是属性构造和数据标准化。

由于数据中并没有直接给出LRFMC5个指标,需要通过属性构造来提取这5个指标。具体的计算方式如下:

(1)L=LOAD_TIME-FFP_DATE

(2)R=LAST_TO_END

(3)F=FLIGHT_COUNT

(4)M=SEG_KM_SUM

(5)C=avg_discount

实战:航空公司客户价值分析

代码如下:

实战:航空公司客户价值分析


数据提取后,其数据取值范围如下:

实战:航空公司客户价值分析