如何计算用户生命周期LT/CLT?

最近给实习生普及生命周期的知识,为了怕露怯,所以特意查看了一下相关的文章,看了不少文章,概念我是明白了,但是在计算生命周期的过程很多文章就简略了,特别是拟合函数的迭代次数这个点,都没有详细说,拟合函数迭代次数会直接影响生命周期的结果,我按照以往的经验给出拟合函数迭代次数的计算方式,本次分享出来算是一个小的总结。

用户生命周期的定义

一个用户的生命周期缩写为LT或者CLT(Life Time / Custom Life Time )指的是,用户从第一次使用产品到最后流失的间隔时间(用户不流失就没有生命周期这一说)。从这个定义上来讲,一次性消费类的产品的生命周期就没意义了,因为周期是0,这类产品例如:婚纱摄影、结婚钻戒等。我们所说的生命周期一般适用于产品有重复消费的情况,并且消费间跨度不会很长,这个很长可以认为1年以上我们就说这个跨度很大了,比如刚需房屋的购买,可能好几年才会再考虑置换,这种产品谈用户生命周期意义不大。

在日常的分析过程,不会单独看某一个用户的生命周期,没多大意义,我们会看一群人的生命周期,所以平时大家口中的生命周期其实是一个均值,是这群用户生命周期的算数平均值,算法如下:

生命周期(Life Time )= 用户总留存时间 / 总用户数

如何计算用户生命周期?

  • 1 完整周期统计法

    直接统计每一个用户的留存时间,然后计算均值。计算步骤是:
    1、事先定义什么情况下可以认为用户流失了,比如定义:2个月没有登陆行为的用户,就定义为流失用户。
    2、确定分析的用户群。按照实际分析需求,确定是分析历史所有用户的生命周期,还是某段时间内的用户生命周期,需求不一样统计出的生命周期长度也是不同的,对于互联网的数据分析,我是很少见不分产品时间段统计周期的,都是在不同的阶段比如:运营拉新活动后统计新增用户的生命周期,以此来评估用户情况。
    3、第二步得到要统计的用户群后,开始计算流失的用户留存时间(最后使用时间-第一次使用时间),最后计算留存均值。

方法评价:
这种计算出的留存最准确,但是很少用,因为时效性太差了,指标延迟时间数个月的话,也就失去了指导意义。

  • 2 区间统计法
    事先定义一个统计时间段,并定义流失判定条件为:最后一次活跃时间。计算最后一次活跃时间距离统计点的时间差加和平均。

方法评价:
这种计算出的留存误差比较大,因为流失用户与非流失用户合到一起计算,不过对于低留存产品(比如次日留存1-5%左右)这样计算是可以,因为留存用户对整个指标影响较少,如果留存大于30%,那么留存用户对指标的影响就不能忽略了。

  • 3 留存率估算法
    使用产品7日或者14日留存估算用户的生命周期是互联网行业最常用的办法,这种方式即提高了指标的时效性又减少了留存用户对指标计算的误差。留存率画到坐标轴上,是一个长尾的幂函数。类似下图这样:
    如何计算用户生命周期LT/CLT?
    留存率估算生命周期的算法为:

  • 通过7日或者14日留存数据拟合一个幂函数。

  • 用定积分计算幂函数与y轴(想想为什么不是X轴?)围成的面积,这个面积就是用户生命周期。也有的文章推荐使用excel把拟合出的函数值求出,然后累加函数值来估算用户生命周期的。
    不论是用定积分求解还是用函数值累加,都绕不过到底迭代几次?因为迭代次数会影响最终计算的生命周期值,请看下边迭代次数与计算出的生命周期值。

假定拟合函数为:y=x^-0.4548

下图为该拟合函数累加值与迭代次数的关系,可以看出迭代次数多累加值也就会增加,迭代次数的选取就显得很重要了,我这边的经验方法为:指定一个最小间隔比如0.01(根据实际可调整),如果两次迭代之间的函数值小于0.01,我就认为迭代可以结束了。上边的举例的拟合函数,按照这个算法需要迭代316次,求得的用户生命周期为41天。

如何计算用户生命周期LT/CLT?