To DN:
01 建模概览
02标准建模流程:数据准备
02标准建模流程:样本定义与数据集构建
02标准建模流程:特征工程
02标准建模流程:模型构建
概述
不同业务场景虽然具备大致的建模流程,即分为数据清洗、标签定义、样本划分、特征工程和建模及调优几个步骤,但是细分的逻辑上存在些差异。
应用
1 流失预警
一般是让模型学习已经流失用户在流失前N个月的行为特征,然后用模型来预测目前活跃用户的潜在流失概率,对高概率用户进行用户维护。
1.1样本的定义
不同业务场景对流失用户的定义不大相同:电信运营商对流失用户的定义为最近1月已经销号的用户;资讯APP的流失用户定义为用户连续1个月没有访问
1.2 数据集构建
不同定义的时间窗口的选择也不相同,以连续3个月未登录的用户为例,该场景的表现期为3个月,观察期可以为近6个月。假如我们有近一年的用户行为数据,2021/7/1-2021/10/31连续未登录的用户作为训练集的表现期,2021/1/1-2021/6/30为训练集的观察期,2021/11/1-2022/1/31连续未登陆的用户作为测试集的表现期,2021/5/1-2021/10/31作为测试集的观察期。
2 潜客线索质量评估
通过业务逻辑/聚类算法/RFM模型等算法对用户进行分群,根据不同的用户群特征实现不同的推荐策略
2.1 样本定义
以电商广告推荐场景为例,若使用RFM模型,可选取用户广告点击率、购物深度、点击商品平均价格三个维度来衡量用户价值标准:广告点击率——反应用户在平台的活跃程度、购物深度——体现用户在平台上的持续购物深度、点击商品价格均值——体现用户的潜在消费能力。
通过设定不同的区间,可将用户划分为以下几类:
● 重要价值用户——用户活跃度高、点击广告商品价位高,这部分用户对企业的潜在贡献价值很高,属于企业的优质用户
● 重要发展用户——用户活跃度较低,与企业交易很频繁,点击广告商品价位高,但存在一定的流失风险,该类高价值用户是企业利润的潜在来源
● 重要挽留用户——用户活跃度较低,与企业的交易频率较低,点击广告商品价位较高,这类用户有很高的潜在价值,可采取针对性营销手段吸引他们,提高其广告商品点击率
● 一般价值用户——用户活跃度高,点击广告商品价位低,购买能力有限,属于价格敏感型用户
● 一般挽留用户——用户活跃度低,点击广告商品价位低,该部分用户已无法立刻为企业产生价值
2.2 数据集构建
根据分群后用户制定不同的推荐策略后,进行ABtest,一部分用户采用原有的推荐策略,另一部分用户采用分群后对应的策略,观察业务指标的变化情况。