用户留存率R的由来 以及 留存率的计算
R的由来
开门见山
假设我们某产品新增一批用户,新增用户总数为Num
我们设第n天时,这部分用户中留存下来的用户数为Num(n),即,第n天依旧登录/活跃的用户
那么,
这批用户的总生命周期为LT(all)
LT(all) = Num*1 + Num(1)*1 + Num(2)*1 +Num(3)*1 + ... + Num(n)*1
这批用户的平均生命周期LT就为
LT = LT(all)/Num = Num/NUm + Num(1)/Num + Num(2)/Num + ... + Num(n)/Num
这里的Num(n)/Num
就是留存率R(n)
,就表示第n天的留存率
R(n) = 第n天的用户留存量/总用户留存量
LT 的一种计算方式就是
LT = 1 + SUM( R(n) )就是对每天留存率的累和
但更加准确的LT的计算方式需要更多的数据,甚至是对未来发展趋势预测出来的数据来充实LT的计算过程,使得LT更加贴合现实情况,详见
留存率的计算
简单来看就是
留存人数/新增人数
需要注意的是算术平均数与加权平均数对留存率的影响,详见:
https://www.zhihu.com/question/35541068 中Wise的回答
或者
https://baijiahao.baidu.com/s?id=1672723291636599258&wfr=spider&for=pc
在这里仅贴图以防止原回答丢失
图1
图2
图3
图4
在图3中可见,标红的部分数据由于使用的计算方式不用(算术平均数与加权平均数),导致T1留存率影响较大,分别是39.76%和32.91
这是因为算术平均数受极值影响大,且7月6日的新增人数暴跌时T1的留存人数刚好处于一个较高的水平。
留存率权重
是如何计算出来的还没有完全搞懂,希望看官指点