老板提用户流失,可能是对于行业流量见顶的焦虑,深感阻止用户流失刻不容缓;运营提用户流失,可能是觉得花老大劲儿拉来的用户,总得做点什么,不能让他们白白流失,不过更多时候,是kpi没完成,想把锅甩给用户流失的大趋势;数据分析师提用户流失,可能是对用户做了分层/分类之后,发现其中有那么一两类用户即将流失,需要针对性做点什么动作来挽回。所以说虽然大家聊的都是“用户流失”四个大字,但往往不在一个频道。
用户流失的两个关键:
一是“动作”,二是“时间范围”。动作的判断标准可能是登陆、在线时长、购买行为;时间范围是超过某个时间范围就当作用户流失。动作很容易在内部达成共识。下面主要分析如何界定时间范围。拍脑袋法可能会说是阈值是120天,150天,180天或是1年,以经验为借口。严谨点的会说是行业通用法则或者是参考产品消耗周期,但这么回答的,大概率是没有真正调研过行业具体情况,更没有拉过各种产品消耗周期数据的。
如何用数据科学界定流失?
先说个体。因为对产品、品牌无感,或者经历了很差的购物体验,有的用户虽然最后一次购买距今只有15天,但其实已经流失了。有的用户沉寂150多天,就是为了等下波大促囤货。还有用户已经1年多未复购过,但是一年半后他又回来复购了。还有用户已经1年多未复购过,但是一年半后他又回来复购了。
再说总体。量化的核心逻辑,是挖掘出不同时间范围用户,在此后一段时间的回购率分布。通过用户最近一次交易行为距离某个时间点的远近,以及对应回购的概率,来描绘分布,找到拐点(魔法数字)。
分析方法:
第一步,设定一个时间锚点,界定区间。
比如2021年1月1日。以此时间点为分界锚点,确定流失分析的时间区间和回购分析的时间区间。区间的界定有一定灵活性,回购分析区间的时间要尽量覆盖锚点前用户的预期复购时间,不能太短,一般会在3个月以上。假设案例中的品牌消耗周期较长,有大促囤货心智,所以回购分析区间长度是一年。
第二步,在流失区间内分析用户距锚点的时间差。
第三步,判断回购区间内是否回购。
第四步,跳出个体用户视角,分析 距锚点的时间差 和 回购区间是否购买 的分布关系。
有了个体用户视角的明细数据,根据距锚点的时间差和回购区间内是否回购这两列数据,很容易透视得到汇总的数据:
用可视化刻画更加清晰:
结果显而易见:不同的时间差区间,回购的概率差异很大。最近一次购买时间距离锚点30天以内的用户,在锚点之后的时间范围,回购概率高达35%。最后一次购买时间越远,其后回购的可能性也越低。根据分布图,有两种方法可以帮助我们解决“到底几天才算是流失”的问题。
可接受阈值法:
不同的业务模式、阶段,对用户流失的容忍度是不同的。有的业务模式认为用户回购概率低于15%,就应该算流失,做相关的预警和召回动作。那从图上来看,150天是一个合适的阈值。因为一旦超过150天,用户的回购率就低于15%。
拐点法:
通过观察曲线拐点,我们发现211-240天之后,用户回购率有一个明显的崎岖(下拐),从11%下跌至不足7%。意味着超过240天,用户回购率有一个明显到肉眼可见的下降幅度,突破了原有的平滑趋势。可以把240天这个突破点(拐点)作为用户是否流失的阈值。如果用户最近一次购买距今已经超过240天,那他很可能已经流失。拐点法除了要判断拐点,在用的时候,也要结合不同区间的量级分布。