实战:航空公司客户价值分析
一、 背景与挖掘目标
试图实现以下目标:
(1)借助航空公司数据,对客户进行分类。
(2)对不同类别的客户进行特征分析,比较不同类别客户的价值分析。
(3)对不同价值的客户类别进行个性化服务,制定相应的营销策略。
二、分析方法
使用 LRMFC模型来进行分析
L:
三、数据探索
注意观察describe()函数参数变化。
(1)
(2)
导出后的Excel文件如下:
四、数据预处理
1、数据清洗
由数据探索分析可知,数据中存在缺失值,存在票价最小值为0、平均折扣率为0但飞行公里数却大于0的记录。由于这些记录的数量不多,所以对其进行丢失处理。
PS:在Excel中对
SUM_YR_1 |
SUM_YR_2 |
SUM_YR_2 |
2、属性规约
根据LRFMC模型,选择与该模型相关的6个属性:FFP_DATE、LOAD_TIME、FLIGHT_COUNT、avg_discount、SEG_KM_SUM、LAST_TO_END
结果如下:
3、数据变换
数据变换是将数据转换成“适当的”形式,以适应挖掘任务和算法的要求。本案例中采用的数据变换方式是属性构造和数据标准化。
由于数据中并没有直接给出LRFMC5个指标,需要通过属性构造来提取这5个指标。具体的计算方式如下:
(1)L=LOAD_TIME-FFP_DATE
(2)R=LAST_TO_END
(3)F=FLIGHT_COUNT
(4)M=SEG_KM_SUM
(5)C=avg_discount
代码如下:
数据提取后,其数据取值范围如下: