logo
登录 / 注册

LTV预估,给你的产品算算命

头像
刘必晟
2020-03-06 · 高级销售经理
LTV(Life Time Value),也即用户在生命周期中贡献的商业价值,是用户增长中非常核心的一个指标项。快速准确的对 LTV 进行建模预估,对于产品商业能力衡量、渠道质量优劣评估、甚至产品的商业闭环能否跑通都起着关键作用。本文将主要介绍 LTV 建模及其场景应用。 几个基本的概念: LTV:Life Time Value,指用户在整个生命周期中贡献的商业价值;LTV365 也即用户在新增期后的 365 天所贡献的商业价值。 CAC:Customer Acquisition Cost,指获取一个用户所付出的成本,例如在 SEM 渠道获取一个激活用户所花费的费用。 ROI:Return On Investment,投资回报率,ROI=LTV/CAC。 LTV 伴随着整个产品方方面面的决策,最主要应用在以下 2 类场景: 产品行不行:通过 LTV,我们可以清晰计算出用户在产品中的活跃周期,商业价值,再与用户成本进行对比,即可辅助分析产品的商业闭环是否成立,资金周转周期快慢、盈利状况如何。 渠道好不好:通常产品都会从多个渠道去获取用户(预装、store、信息流、SEM ……等等),每个渠道获取用户的成本不一样,新用户的质量更是参差不齐。因此需要对每个渠道的新增用户价值进行预估,通过 ROI 来评估渠道质量的好坏。 LTV 预估问题定义: LTV 是用户从首次使用到离开产品,整个生命周期贡献的商业价值。图 1 展现了用户完整的价值累积过程示意图,用户在前 7 天贡献了约 3 元,前 30 天贡献了约 8 元,整个生命周期持续了约 133 天,累计商业价值约为 14 元,也即用户的 LTV 约为 14 元。如果我们已经知道了用户整个生命周期中各个阶段的商业价值,可通过直接统计得到用户 LTV。然而很多时候,用户的生命周期持续时间很长(几个月甚至到几年),如果等用户经历了整个生命周期再来计算用户 LTV,对于绝大多数商业决策是严重滞后的。因此需要对 LTV 进行预测,通过用户一定时间窗口(例如 7 天,14 天)的实际数据,预估用户整个生命周期的 LTV。  图 1 用户 LTV 示意图 LTV 反应的是用户商业价值,与产品的盈利模式密切相关。互联网产品主流盈利模式主要有以下几种:电商、广告、游戏、打赏,不同的盈利模式下用户 LTV 计算方法均各不相同。例如电商类型的产品,用户 LTV 主要与用户日(月)均消费额、商品毛利率、用户日(月)流失率相关;以广告收入为主的产品,用户 LTV 主要与用户的留存率和日均贡献广告收入相关。 首先介绍一种通用方法,对于大多数产品而言,用户在刚开始阶段贡献较多的价值,随着用户逐渐流失,商业价值越来越低,直至归零。因此用户 LTV 过程呈现出图 1 的走势,很类似幂函数(指数小于 1)或者 logistic 函数(sigmod 函数)形状。因此可以采集用户前 N 天实际产生的数据,通过幂函数、logistic 回归、或者神经网络对 LTV 建模预测未来趋势,从而计算得出用户 LTV。这种方式由于没有深入建模产品的收入过程,因此 LTV 预估准确率相对较为一般。限于篇幅,本文主要介绍广告收入类型产品的 LTV 预估方式。 相关定义 LT:Life Time,指一段时间时间窗口内用户的活跃天数。 ARPUDAU:活跃用户日均 ARPU 值,也即用户活跃一天所能带来的日均收入。 R:用户日留存率,例如次日留存率、7 日留存率等,第 t 天留存率记为 R ( t ) 。 本文以这个示例作为阐述:某个渠道 1 月 1 日新增的用户(新增用户规模为 Count),累计了 14 天的真实用户数据来预估其 LTV 值,以评估该渠道质量是否满足 ROI 要求。  图 2LTV 计算公式 1 LTV 是一个统计意义上的指标,指某个用户群体的均值,单独计算某一个用户的 LTV 值是没有意义的。因此可以按照图 2 的公式计算出 LTV,第 t 天这部分用户贡献的平局收入为 Count * ARPUDAU ( t ) * R ( t ) / Count,累积整个生命周期的时间段即为用户 LTV(也即公式中的西格玛求和)。  图 3 用户 ARPUDAU 示意图 图 3 展示了每天 ARPUDAU 值随时间的变化情况,可以发现用户每天的 ARPUDAU 值是相对稳定的,因此可以认为 ARPUDAU ( t ) 是一个常数。在此条件下图 2 中的公式可以进一步推导为图 4 的公式,也即 LTV=LT*ARPUDAU,在 ARPUDAU 稳定不变的情况,全生命周期的价值就等于用户的活跃天(LT)和每天价值(ARPUDAU)的乘积。到此,我们如果只需要计算 ARPUDAU 和留存率 R ( t ) ,即可得到用户的 LTV。  图 4LTV 计算公式 2 1. ARPUDAU 计算: 从图 3 可以看到,用户的 ARPUDAU 是相对稳定的,如果已经获得了用户 14 天真实的行为数据,对这 14 天的数据直接进行统计然后求平均,即可得到一个相对准确的 ARPUDAU 数据了。 1.1 从图 3 仍然可以发现 ARPUDAU 走势中,会有很多毛刺的现象,某些节点上下波动较大,例如恰逢双 11,某几天广告收入异常偏高,与其他时间的广告收入相差很远。为了做出更准确的预测,需要进行异常点检测,过滤掉这些异常数据再求均值。常见的异常点检测算法均可使用,例如 Numeric Outlier、Isolation Forest、DBSCAN 聚类等算法。 1.2 如果不是全新的渠道,还可以借助该渠道之前的历史数据,进一步增强样本数据。除了已知的 14 天数据,还可以参考该渠道之前的 3 个月数据,然后对于对这 3 个月的 ARPUDAU 做时间衰减(时间越近,越能反应当前产品的商业收入现状),累积到 ARPUDAU 计算中,对 14 天得出的数据结果进行修正。 1.3 更进一步,用户的 ARPUDAU 还可以建模成用户消费行为、用户活跃程度、产品变现能力三个维度的函数变量,可以用一个更复杂的模型对于 ARPUDAU 进行预估和修正。  图 5 留存率变化趋势示意图 2. 留存率 R ( t ) 预估: 图 5 展现了这部分用户留存率变化趋势图,不难看出用户的留存率走势和幂函数形状很类似,因此可以用幂函数,结合用户前 14 天已知的留存率数据,对未来趋势进行拟合,得出留存率预估函数 y=b*x^a。 2.1 幂函数可以较好的拟合留存率整体趋势图,尤其是趋势的头部可以拟合得非常精准,但对于趋势尾部拟合较差(幂函数尾部过高或者过低)。如图 6 所示,可以对目标函数进行扩展,除了幂函数之外,还可以通过指数函数簇进行拟合。根据各个渠道的历史数据,针对不同的渠道类型,选择最合适的目标函数。 2.2 幂函数 y=b*x^a 只会无限接近 0,但是不会等于 0,因此在实际建模过程中,需要选定一个阈值 alpha,当留存率低于 alpha 时,认为用户生命周期结束。alpha 的选择需要根据留存率变化的实际趋势来确定,例如 1%,5% 等。  图 6 留存率预估函数示意图 TIPS1:判断渠道质量的时候,选用多长时间窗口预估 LTV 更适合? 当 LTV 用于判断渠道质量时,很重要的一件事情是选择时间窗口,也即需要累积多长时间实际样本数据来预估 LTV。如果时间窗口较长(例如 3 个月),LTV 预估结果与真实值偏差较小,但是意味着我们对于渠道的筛选决策要延后 3 个月。 如果时间窗口较短(例如 3 天),LTV 预估结果与真实值偏差较大,但是决策周期可以很短。在实际场景中,需要根据模型实际效果来确定合适的时间窗口。对于广告收入为主的产品,一般选择 7~14 天,ltv 模型预估准确率可达到还不错的一个水平,7~14 天也是产品可以接收的决策周期。 TIPS2:除了 LTV 预估模型的准确率之外,更重要是要构建一个完整的 LTV 数据服务。由于产品自身的商业能力的迭代,以及渠道的复杂和不可控性,LTV 会经常发生变动,以至于模型准确率也会经常发生波动。因此需要对 LTV 预估结果做完整的跟踪监控,以便支持产品做更迅速准确的商业决策。
LTV预估,给你的产品算算命脉脉
阅读 25
声明:本文内容由脉脉用户自发贡献,部分内容可能整编自互联网,版权归原作者所有,脉脉不拥有其著作权,亦不承担相应法律责任。如果您发现有涉嫌抄袭的内容,请发邮件至maimai@taou.com,一经查实,将立刻删除涉嫌侵权内容。
相关推荐
最新发布
大家都在看
热门人脉圈
    头像
    我来说几句...
    脉脉App内打开