精益数据分析 - 笔记 (一)
序
全书分成以下四个部分
第一部分:给了几个案例,指出什么是好的数据指标。
第二部分:
第三部分:
第四部分:
第一部分
- 可以给别人画大饼,这在创业初期是不可避免的,但是自己心里一定要对公司的真实情况非常熟悉;
- 在将一个新的想法推广给全部客户之前,可以先选择小部分客户进行实验;
好的数据指标:
* 具有比较性:能够比较在不同时间段、用户群体、竞争产品之间表现的数据指标,可以更好的洞察产品的实际走向。“本周 的用户转化率比上周高”显然比“转化率为2%”更有意义
*简单易懂
*是一个比率
- 比率的可操作性强,是行动的向导。以销售数据为例:月已销售额只是销售金额信息,而月已销售额/月销售目标 才真正具有可操作性。这个比率告诉你本月截止到今天,已完成销售目标的多少,以及是否需要采取措施提高销量以确保达到目标
- 比率是天生的比较性指标。将日数据与一个月的数据进行比较,可知当前状态是一个短期的波动,还是长期的趋势。以销售数据为例:今日销售额是一个数据指标,只有将今日销售额与过去一个月的日平均销售额进行比较,才知道今日销售额是上升还是下降
- 比率还适用于比较各种因素间的正相关和负相关。以开车为例:单位时间内行驶的里程/罚单数这个比率显示了二者的关联性。开的越快,行驶的里程越多,收到的罚单就越多。这个比率可以帮助决定是否应该超速。
ps: 我们知道,一般情况下促销力度越大,下单的人会越多。但促销力度越大带来的单笔净利润也会越少。我们希望在订单数提高的同时,单笔净利润也不至于很低(为开拓市场或提高产品知名度等特殊情况除外)。这里显然比例函数已经不够用了,需要根据历史数据构建Sigmoid函数或指数函数寻找约束范围内的最佳促销力度。
*会改变行为:随着指标的变化,你是否会采取相应的措施?
下面是指标的几种分类:
- 定性指标与定量指标:
定性指标通常是非结构化的、经验性的、揭示性的、难以归类的,在创业初期,没有足够的历史数据的时候
定量指标则涉及很多数值和统计数据,提供可靠的量化结果,但缺乏直观的洞察
- 虚荣指标与可付诸行动指标:
虚荣指标看上去很美,让你感觉良好,却不能为你的公司带来丝毫改变(点击量、页面浏览量(PV值)、访问量、独立访客数、粉丝/好友/赞的数量、网站停留时间/浏览页数等);
可付诸行动指标则可以帮你选出一个行动方案,从而指导你的商业行为:在调整产品的某个功能后,该指标上升还是下降?反映此次调整效果是好是坏?
- 探索性指标与报告性指标:
探索性指标是推测性的,提供原本不为所知的洞见,帮助你在商业竞争中取得先手优势;
报告性指标则反映出公司的日常运营情况
(什么是探索性指标?你的产品已经有一些忠实用户了,也有流失用户、新用户。已经流失的用户很难再回来,但我们应该想办法使得新用户转成忠实用户,此时就需要对忠实用户进行深入分析:他们都有什么共同特征?有着什么样的行为?产品的什么地方吸引他们使得他们成为忠实用户?在得到回答后,采取相应的措施以促进用户黏性)
- 先见性指标与后见性指标:
先见性指标用于预言未来(预测);
后见性指标则用于解释过去,能提示问题的所在
- 相关性指标与因果性指标:
分析方法:
- 市场细分
对用户打标签:苹果用户和安卓用户,在职与学生,火狐浏览器与谷歌浏览器等等
- 同期群分析
比较相似群体随时间是如何变化的。
这个分析方法特别有用,划重点。下面用两张表格加以说明:
1月 | 2月 | 3月 | 4月 | 5月 | |
客户总数 | 1000 | 2000 | 3000 | 4000 | 5000 |
平均每位客户营收 | 5美元 | 4.5美元 | 4.33美元 | 4.35美元 | 4.5美元 |
从上表我们似乎可以看到在这5个月里,客户总数在逐月平稳增长,而平均客户营收先是小幅下降而后有缓慢上升,似乎将会回到初始水平。但从这张表我们并不知道随着时间的增长,新客户带来的营收是否有所变化?老客户的价值如何?而下面的同期群分析表格则回答了这些疑问:
同期群 | 第1个月 | 第2个月 | 第3个月 | 第4个月 | 第5个月 |
新客户数 | 1000 | 1000 | 1000 | 1000 | 1000 |
总客户数 | 1000 | 2000 | 3000 | 4000 | 5000 |
1月 | 5美元 | 3美元 | 2美元 | 1美元 | 0.5美元 |
2月 | 6美元 | 4美元 | 2美元 | 1美元 | |
3月 | 7美元 | 6美元 | 5美元 | ||
4月 | 8美元 | 7美元 | |||
5月 | 9美元 | ||||
平均值 | 7美元 | 5美元 | 3美元 | 1美元 | 0.5美元 |
上表反映的信息就非常多了:随着网站的发展,新客户首月花费有显著增长,且消费下降趋势(可能)有所缓解。在首月注册消费后,客户消费出现递减。
仅看表1.1网站似乎经营进入瓶颈,但由表1.2可知,网站的发展表现良好,有稳步增长的趋势。
- A/B测试
- 多变量分析
精益数据分析周期
精益画布
这是呈现在一张纸上的可视化商业计划书,体现你正在进行的、可付诸行动的商业计划。
需要避免的数据圈套
- 假设数据没有噪声;
- 忘记归一化;
- 排除异常值;
- 包括异常值;
- 忽略季节性;
- 抛开基数谈增长;
- 数据呕吐(数据指标并非越多越好,我们需要知道哪些指标是有价值的,具有指导意义的);
- 谎报军情的指标(对指标设置阈值警报,这个阈值不可以过于敏感,否则将失去其警报的作用);
- “不是在这儿收集的”综合症(汇集来源不同的数据可能会带来独到的见解);
- 关注噪音。