‘数据分析实战’——分析思路和分析视角
第2章 开启分析思路
用户行为包括产生需求,信息收集,方案比选,购买决策和购后行为
用户行为7要素:
时间,地点,人物,事件,原因,方式方法,程度;
第3章 打开分析视角
3.2 对比视角
3.2.1 对比的类型
-
按照参照物:纵向对比与横向对比
纵向对比:对比过去和现在,总结发展变化,形成时间序列
横向对比:对比各自表现,判断优势和劣势,形成截面数据 -
按照对比指标性质:频数统计与均值分析
分类型数据:运用频数统计进行对比
数值型数据:运用均值分析进行对比
3.2.2 对比可信度
-
时间上的可比性
Ex:2018年3月前10天与2017年同期增加不少,深入分析发现2018年3月前10天比2017年同期多一个星期六,进而抬高了销量 -
空间的可比性
Ex:海军死亡率低于居民死亡率;事实是海军死亡率统计对象是年轻人,居民死亡率统计对象是各年龄层的人 -
数量上的可比性
1)对比指标要定量
2)对比对象要同量纲
常用解决方法:变异系数(V=标准差/均值),刻画单位水平下的差异
3.3 相关视角
该视角探索的是事物间的某种联系,这种联系可能是因果关系,也可能是共存关系。
3.3.1 规模预测
利用相关视角可进行规模预测
Ex:
3.3.2 精准营销
开展精准营销前,需弄清用户特征与用户态度偏好的相关关系。
判断相关性的方法:
对于数值型,可计算相关系数
对于分类型,可使用方差分析
Ex: 性别和颜色偏好
方差分析涉及总体信息(SST),组间差异(SSR)和组合差异(SSE)
三者关系为:SST=SSR+SSE
组间差异:组和组之间的差异
组内差异:每组内部的差异
3.4 分类视角
3.4.1 分类的价值
3.4.2 分类的步骤与方法
3.5 描述视角
3.5.1 集中趋势与离中趋势
平均数刻画的是一般水平,是集中趋势;
波动情况刻画的是变异程度,是离中趋势
3.5.2 个体波动的研究价值
- 研究个体能帮助企业进行问题诊断
- 研究个体能找出企业欺诈
- 只看平均数,会掩盖个体间的差异
3.6 如何在业务中选择分析视角
3.6.1 视角与方法
- 对比视角
- 相关视角
- 分类视角
- 描述视角
KANO模型:可用来分析重要性;将属性划分为四类
必备属性
一维属性
魅力属性
可有可无属性
属性改进的优先级可分为:必备属性>一维属性>魅力属性>可有可无属性
- 分类视角
对于重要性和满意度两个维度需要结合起来综合使用
通过重要性和满意度两个维度对各项指标进行分类,从而做出四分图模型
优势区:重要性和满意度都高;可继续投入
维持区:重要性不高,但满意度很高;资源有限时,只需维持就好
忽略区:重要性和满意度都低;资源有限时可忽略
改进区:重要性很高,但满意度很低;旅客很看重但公司没做好,急需改进的指标,优先级最高
- 描述视角
描述视角不仅要看集中趋势,还要看离中趋势
Ex:
1. 分析各站点的波动情况;可看出站点1比站点2餐饮服务更稳定
2. 通过波动分析找出离群旅客;从图中看出旅客满意度与推荐度存在正相关关系,但红圈标注的离群点旅客满意度高,却不愿意推荐,故可对该离群点进行深度分析,挖掘该旅客总体服务很满意但却不愿推荐的原因
- 相关视角
相关视角:主要用于规模预测和精准营销
方差分析(F统计)和交叉分析可探讨旅客特征和旅客偏好,态度的相关性