基于Excel的母婴电商产品分析报告
一、分析背景
母婴用品是指为主要为孕产期女性与0-3岁婴儿这两类特殊相关联群体提供的专业健康产品。中国是仅次于美国的全球第二大母婴用品消费大国,近年来,随着互联网的不断发展,母婴行业与互联网融合的不断加深,互联网母婴用户大幅上涨,母婴电商市场呈快速增长趋势。然而,在业绩增长的同时,店铺经营问题也逐渐凸显,如用户复购率低,新增用户缓慢等,因此需要对母婴用品销售情况进行深入分析,了解目前店铺存在的业务问题,针对性制定解决方案。
二、分析目的
分析近年来各类商品的销售情况,为运营工作提供参考依据,旨在提高用户黏性,提高销量。
三、理解数据
数据获取来源:阿里巴巴天池 Baby Goods Info Data
数据来自淘宝和天猫上购买婴儿用户,本数据集包括2个表格文件:
【表1】购买商品.csv 共7个字段,29971个记录【表2】婴儿信息.csv 共3个字段,953个记录
四、分析思路
4.1 构建业务问题
- 了解成交量的时间分布及周期性变动规律
- 判断畅销品和滞销品分别是哪些
- 分析商品的客户群体特征
4.2 思维导图
五、数据清洗
5.1 字段重命名
根据对字段含义的理解,将字段转化为中文方便理解。
5.2 选择子集
表1,因为商品属性不参与业务问题的分析,因此隐藏商品属性字段下的数据,保留其他子列进行数据清洗;表2,保留所有字段下的数据。
5.3 删除重复值
因为同一个用户可能购买多次,同一种购买行为可能被多个不同用户在不同时间执行,因此应该选择全表,删除重复值,经处理表1 和表2均无重复值。
5.4 缺失值处理
经EXCEL的筛选功能,在表1保留的子列中未发现有缺失值,在表2中也未发现有缺失值
5.5 一致化处理
对于表格中的日期,用数据-分列方式进行一致化处理;对表格中的性别进行一致化处理,性别"0,1,2",分别转换为"男,女,未知"。
5.6 多表关联查询
用Vlookup函数将两表数据关联;对于年龄问题,利用datedif函数计算年龄。
5.7 异常值处理
年龄异常值:对婴儿年龄进行筛选,年龄中大于等于"28"为异常年龄,删除。
六、数据分析
6.1 市场销售情况
如图,2012-2015年度总共有六大类母婴用品,其子类商品种类共计662种,商品成交总数量为76250件;销量最高的是【28】类商品,其子类商品种类高达267种;销量最差的是【122650008】类产品,仅有17种子类商品种类;【28】类商品销量为【122650008】类的12.7倍。
如图可知,2012-2014年成交量整体呈逐年上升趋势,而2015年出现骤减现象,通过观察数据源发现主要原因是由于2012与2015年度数据不全,无法对结论精准对比分析,因此后续部分数据分析以2013-2014年度为主要依据。
如图所示,季节成交数量呈现出明显上升趋势,第一、二季度总体销量相对稳定,第三、四季度为顾客采购旺季,且2014年第四季度环比其他任何季度的成交数量涨幅最大;2013-2015年度每年第一季度成交量都有下滑的现象。
由于2015年度数据不全,故这里只考虑2012-2014年度第三、四季度销售情况。
从数据上看,2012-2014年度第三、四季度总体成交量呈上升趋势,第四季度成交量对比第三季度而言波动较大,且2014年第四季度的商品成交量出现暴增现象。
6.1.1分析2014年度第四季度商品成交量暴增的原因
分析思路:
分析过程:
通过数据对比,2014年度11月成交量的暴增是2014年第四季度商品销量暴增的主要原因。接下来进一步分析2014年度第11个月的销售情况。
从数据上看11月13日的成交量高达10061件,是11月份商品销量暴涨的主要原因,推测可能有是双十一后进一步的促销活动,或者某个大客户的大手笔,接下来进一步分析11月13日各类二级商品的销售情况。
如图所示,根据二级商品成交数量排名前5的商品数据,结合数据源发现用户【2288344467】购买了10000份【50018831】类二级商品,这正是11月13日销量暴增的原因,这里可与相关部门人员商讨确认数据是否录入错误或是其他因素导致,若数据正确无误,我们可将此用户认为是高价值用户,有针对性地实施落地,可以通过给客户赠送优惠等行为提高该客户的忠诚度,进而给企业带来更多利润。
6.1.2分析2013-2014年度第一季度商品销量低的原因
由于2012-2015年地数据不全,故分析2013-2014年度第一季度成交量情况,由于中国农历春节假期大部分集中在1-2月,查询日历可知:2013年春节假期从2月9日开始,2014年春节假期从1月31日开始,从图中可以发现在当年的除夕日前后一周左右成交量呈明显下降趋势,在部分时间段中大部分快递会停运,因此春节假期对第一季度成交量有一定影响。
从数据上看,5月、9月、11月、12月为高峰期,淘宝平台在这几个月活动比较多,如5月份有天猫母亲节、520表白节等活动,11月主要有双11,12月有双12等活动,9月经数据分析发现与11月13日存在相似的大客户购买大量数据的情况,在此不做过多论述。
6.2 产品运营情况
由于商品单价未知,故用成交数量来代替,如图所示,【28】类贡献率高达37%,其次是【50014815】和【50008168】类商品,【122650008】成交量最低,【38】与【500225520】类接近。
为确保数据公平、准确、完整,鉴于2013-2014年数据完整度高,以2013-2014年商品销售数据为分析依据。
从整体上看,2013-2014年度各类商品总销量为65064件,子类商品共662种;其中【28】类商品销量最佳,子类商品【50018831】为畅销品,【12265008】类商品总销售量垫底,为滞销类商品,下图为成交量TOP10的商品:
6.3 用户行为——AARRR模型(用户生命周期)
6.3.1 日新增用户数
2012年新增客户数为183人,日均新增=20,2012/11/11日新增人数年度最高为139人;
2013年新增客户数为365人,日均新增=27,2013/11/11日新增人数年度最高为257人;2014年新增客户数为365人,日均新增=41,2014/11/11日新增人数年度最高为454人;
2015年新增客户数为36人,日均新增=44,2015/02/02日新增人数年度最高为57人;
淘宝天猫平台每年双十一举行购物狂欢节,因此每年11月11日成为全年新增人数最高的一天。
6.3.2 复购率
重复购买客户数量/客户样本数量
千分位换算:=TEXT(A1*1000,“0.00!‰”)
复购商品类型
从数据上看,根据【用户ID】汇总,目前总客户数为29943人,其中只有25位客户选择重复购买,复购率极低,复购商品主要集中在【38】和【50008168】这两类商品。
由于此份数据源局限性,无法进一步计算活跃率、留存率/流失率、转化率等AARRR模型相关业务指标,进而无法对导致复购率低的相关问题因素进行深入分析。
6.4 用户价值——构建RFM模型
6.4.1 计算R、F、M值
R=最近一次购买距今多少天
F=购买频率
M=累计购买数量(由于数据中未提供购买金额,因此用购买数量来代替)
按”购买时间“排序,发现订单数据时间范围是2012年7月2日-2015年2月5日,由于订单是截止至2015年2月5日,我们假设建模时间为2015年2月6日,求每个客户R值,就是求2015年2月6日之一天具体他最近一次付款时间的间隔天数。
6.4.2 维度确认——给客户的(R值、F值、M值)打分
- 最近一次消费时间间隔(R),上一次消费离得越近,即R值越小,客户价值越高。
- 消费频率(F),购买频率越高,即F值越大,客户价值越高。
- 累计购买数量(M),购买数量越高,即M值越大,客户价值越高。
以R值为例,这个值越大,说明客户越久没有没有回购,他流失可能性也更大;这个值越小,就表明客户最后一次付款时间距离现在越近。
引用IF函数:=IF(表达式,表达式为真的操作,表达式为假的操作) 例如:IF(A1>1,“大于1”,“等于0”),就是如果A1的值大于1,公式所在的单元格就显示为大于1,否则就显示为等于0。IF的强大之处在于它可以无限嵌套。R=IF(D2<180,5,IF(D2<360,4,IF(D2<540,3,IF(D2<720,2,1))))
F=IF(F2<2,1,IF(F2<3,2,IF(F2<4,3,IF(F2<5,4,5))))
M=IF(H2<100,1,IF(H2<200,2,IF(H2<300,3,IF(H2<400,4,5))))
6.4.3 判断每个客户的R、F、M值是否大于平均值
用AVERAGE求平均值,并把每个客户的3个值与平均值进行比较,用IF(值>=平均值,“高”,“低”)即可,进行二次判断,大于平均值的显示高,小于的显示低。(二次判断是为了简化分类结果,经过二次判断,客户分类结果最多只有8类)。
6.4.4 客户分类
和客户价值分类表格里定义的规则进行比较,就可以得出客户属于哪种类别分析各类商品的客户群体特征。
客户分类=IF(AND(J2=“高”,K2=“高”,L2=“高”)=TRUE,“重要价值用户”,IF(AND(J2=“高”,K2=“低”,L2=“高”)=TRUE,“重要发展用户”,IF(AND(J2=“低”,K2=“高”,Q2=“高”)=TRUE,“重要保持用户”,IF(AND(O2=“低”,P2=“低”,Q2=“高”)=TRUE,“重要挽留客户”,IF(AND(O2=“高”,P2=“高”,Q2=“低”)=TRUE,“一般价值用户”,IF(AND(O2=“高”,P2=“低”,L2=“低”)=TRUE," 一般发展用户",IF(AND(J2=“低”,K2=“高”,L2=“低”)=TRUE,“一般保持用户”,“一般挽留客户”)))))))
二八法则——产品80%的收入都是由20%的用户贡献的,找到核心用户。
核心客户:
- 重要价值客户,RFM三个值都很高,要提供vip服务
- 重要发展客户,消费频率低,但是其他两个值很高,就要想办法提高他的消费频率
- 重要保持客户,最近消费距离现在时间较远,也就是F值低,但是消费频次和消费金额高。这种用户,是一段时间没来的忠实客户。应该主动和他保持联系,提高复购率
- 重要挽留客户,最近消费时间距离现在较远、消费频率低,但消费金额高。这种客户,即将流失,要主动联系客户,调查清楚哪里出了问题,并想办法挽回
6.5 用户特征——性别&年龄
6.5.1 分析思路:
6.5.2 分析过程:
6.5.2.1 不同性别婴儿对商品成交量的影响
从数据上看,不同性别婴儿的消费总人数为952人,其中男女宝宝消费总人数为926人,女婴的消费人数为488人,比男婴的消费人数多50人,但男女占比差距不是很大,所以不构成影响商品总体销量的主要因素。
从数据上看,不同性别宝宝的人均购买量差距较大,女婴的人均购买量比男婴的多了49%,此因素可能是构成女婴的商品总体销量偏高的主要原因。
6.5.2.2 不同性别婴儿对商品的选购情况
从整体上看,女婴对【50014815】类商品的需求量最大,其次是【50008168】类商品,而男婴则对【50008168】【28】【50014815】类商品的需求更大些;其中【50014815】类商品的女生受众群体偏多,而【50022520】类商品的男生受众群体偏多。
6.5.2.3 不同年龄阶段婴儿对商品的总体需求情况
从数据上看,0-2周岁婴儿对商品的需求量最大,约占整体购买人数的一半,其次是2~5周岁的婴儿,8周岁及以上用户的需求最少。
分析0~2周岁婴儿对商品的需求情况
从数据上看,在男、女宝宝客户数相同的情况下,女婴对商品的需求量约为男宝宝的1.85倍,人均购买量约为男婴的2倍,在众多商品中,0~2周岁的女婴对【50014815】类商品需求量最大。
6.5.2.4 不同年龄阶段婴儿对各类商品的偏好情况
综合比较,0-2周岁婴儿对商品的需求度最大,其中对【50014815】类商品的需求量更高,父母也会为即将出生的婴儿提前多准备【50014815】类商品,而2-5周岁婴儿的父母更倾向选购【50008168】类商品,5-8周岁婴儿的父母除【50008168】类商品几乎不太需要其他商品,8周岁及以上婴儿则对除【50008168】类商品外其他商品几乎没有需要。综上所述,各类商品的受众用户特征情况如下图。
【28】类商品:女婴使用偏多,受众客户大多在5周岁以下(含未出生),主要集中在0-2周岁,其次2-5周岁;
【50008168】类商品:女婴使用偏多,受众客户大多在8周岁以下(含未出生),主要集中在0-2周岁,其次2-5周岁;
【500014815】类商品:女婴使用偏多,受众客户大多在5周岁以下(含未出生),主要集中在0-2周岁,其次是未出生;
【38】类商品:女婴使用偏多,受众客户大多在0-5周岁,主要集中在0-2周岁;男婴的受众年龄大多在0-2周岁;
【50022520】类商品:受众客户大多在5周岁以下(含未出生),主要集中在未出生阶段,男婴使用偏多;
【122650008】类商品:男、女用户数相差不大,受众客户大多在0-5周岁,主要集中在0-2周岁。
七、结论
市场销量方面:
2012-2015年度淘宝天猫母婴用品共分为六大类,共计662种子类商品,总销量达66250件;2013-2014年度成交量整体呈上升趋势,每年第三、四季度为顾客采购旺季,每年第一季度受中国春节假期影响,均出现了下滑现象;2014年第四季度受11月13日销量影响,销量暴增, 推测有促销活动或是由于某个大客户的大手笔;每年5月、9月、11月、12月的成交量为销售高峰期,一方面淘宝平台在这几个月活动较多,如5月有“天猫母亲节”、“520表白节”等活动,11月主要有“双11”、12月主要有“双12”等活动;
产品运营方面:
【28】类商品总销量最佳,有267种子类商品,商品贡献率最高达43%,其次是【50008168】和【50014815】类商品,【38】和【50022520】成交量相差不大,【122650008】成交量最低,为滞销类商品,仅17种子类商品;【50012788】子类商品为畅销品。
用户行为方面:近年来,由于淘宝天猫平台每年11月11日举行促销活动“双十一”,每年11月11日新增大量客户,但店铺年度日均新增客户数并不高,而且用户复购率极低,目前总客户数为29944人,其中只有25位客户选择重复购买,复购的商品主要集中在【38】和【50008168】这两类商品。
用户价值方面:
构建RFM模型并将客户分为“重要价值客户”、“重要发展客户”、“重要保持客户”、“重要挽留客户”、“一般价值客户”、“一般发展客户”、“一般保持客户”、“一般挽留客户”八类,依据二八法则,其中核心客户仅有30位。
用户特征方面:
不同性别婴儿的消费总人数为952人,女婴的消费人数为488人,比男婴的消费人数多50人,虽然男女占比差距不是很大,但人均购买量差距较大,女婴人均购买量比男婴多49%;其中女婴对【50014815】类商品的需求量最大,其次是【50008168】类商品,而婴儿对【50008168】【28】【50014815】类商品的需求更大些;从年龄上看,商品的受众用户大多在5周岁以下(含未出生),其中0-2周岁婴儿对【28】【50008168】【500014815】【38】【122650008】类商品的需求量较大,约占总用户的一半,在男、女婴儿客户数相同的情况下,女婴对商品的需求量约为男宝宝的1.85倍,人均购买量约为男婴的2倍,在众多商品中,0-2周岁的女婴对【50014815】类商品需求量最大;父母也会为即将出生的婴儿提前多准备【50014815】类商品,【50022520】类商品受众用户也主要集中在未出生阶段,男婴使用偏多;而2-5周岁婴儿的父母更倾向选购【50008168】类商品,5-8周岁婴儿的父母除【50008168】类商品几乎不太需要其他商品,8周岁及以上宝宝则对除【50008168】类商品外其他商品几乎没有需要。
八、建议
积极开展促销活动
从2012年以来的销售趋势来看,第三季度和第四季度销售表现优于前两季度,说明促销活动一定程度可以刺激销量增长,因此要灵活地开展促销活动,可以在第一季度和第二季度适当增加促销活动,尤其要重视店庆、“双十一”、“双十二”等,通过成熟和精准的促销模式来吸引用户,提高销量;其次根据各商品种类的销售旺季和淡季,做好货物安排工作,提前预测进货数量,保证货源的稳定性、多样化,及时发货;与物流公司沟通好商品的配送。
利用热销品带动滞销品
对于热销产品,销量前十的商品作为店铺的爆款商品运营,尝试将热销商品的营销模式应用到其他商品中;推动用户自传播,可以通过粉丝福利活动来推广销量低的商品,增加其曝光,提升客户转化率;同时将热销商品与销量低的商品进行捆绑销售,带动销量的增加。
实施精准营销策略
根据RFM模型,采取精准营销策略,提供对应的跟踪服务,维护与用户之间的关系;关注竞争对手的动作并采取相应的措施应对来降低用户的流失;简化购物流程来减少用户的犹豫时间,方便用户选购商品;根据用户偏好为其智能推荐相关商品,提高点击率和转化率,从而提高商品复购率,增加用户粘性。
基于性别推出特定婴儿套餐
目标用户集中在5岁以下的婴儿,尝试推出针对男婴的组合套餐,采取不同的促销手段(如优惠券,客户回访),提高男婴的人均购买量,另外男婴、女婴的父母大多数每次订单都仅下单一种类型商品,根据这个情况制定合适的销售计划,如推出组合套餐(男婴套餐,女婴套餐,热销产品搭配滞销产品,捆绑销售等等),满额包邮或送优惠券等等,同时在维系客户关系,在孩子年龄增长阶段及时推荐适用下个年龄阶段的适用商品,来促进销量增长。