留存分析是一种非常常规的用户行为分析方法,利用集合关系和漏斗图非常方便地完成。
不过今天咱们说的并不是这个,而是留存分析的逆应用,即根据事先设定好的留存率选择会员
设定两个交叉的项目,项目A的会员要受项目B的约束;
即A中所有会员,必须全部来自于B(A<=B),或者来自于B的全部(A>B)。*
实现:
1、求A、B列的较大值(可规避strata()中size不能取0的问题。);
2、以上一步的取值从全量表中进行分层抽样(层:注册/下单日期);
3、以A、B的取值从上一步得到的样本中进行抽样。