uplift在营销领域建模的4种方法

背景& 前置说明

因果推断在营销场景的应用主要是基于uplift Model预测营销干预带来的增益

Uplift model是一个增量模型,其目标是预测某种干预对于个体状态或行为的因果效应(ITE, individual treatment effect),那么如何表示这个增益模型呢?

假设有N个用户, Y i ( 1 ) Y_i(1) Yi(1)表示对用户干预后用户输出的结果,比如给用户i发放优惠券(干预)后用户下单(结果), Y i ( 0 ) Y_i(0) Yi(0) 表示没有对用户干预情况下的输出结果。用户i的因果效应的计算方式如下:
τ i = Y i ( 1 ) − Y i ( 0 ) \tau_i = Y_i(1) - Y_i(0) τi=Yi(1)Yi(0)
训练增益模型目标就是最大化增量 τ i \tau_i τi,即有干预策略相对于无干预策略的提升,更简单的解释就是干预前后用户输出结果的差值。在实际使用时会采用所有用户的因果效应期望来衡量该用户群的整体表现,称为条件平均因果效应(CATE, Conditional Average Treatment Effect):
τ i = E [ Y i ( 1 ) ∣ X i ] − E [ Y i ( 0 ) ∣ X i ] \tau_i = E[Y_i(1)|X_i] - E[Y_i(0)|X_i] τi=E[Yi(1)Xi]E[Yi(0)Xi]
上式中 X i X_i Xi是用户i的特征。

一、uplift建模的方法

在建模前我们需要注意一个很重要的问题:Uplift Model对样本要求很高,需要用户特征和干预策略相互独立。

那么什么样的样本用户有这样的特征,这样的样本又该如何获取?

最简单直接的方式就是随机A/B实验,A组采用干预策略,B组不进行任何干预,经过A组和B组的流量得到的两组样本在特征分布上基本一致(即满足CIA),可以通过模拟两组人群的 τ ( X i ) \tau(X_i) τ(Xi)进而得到个人用户的 τ ( X i ) \tau(X_i) τ(Xi)。因此随机A/B实验在Uplift Model建模过程中至关重要,在训练样本高度无偏情况下,模型才能表现出更好的效果。

本文详细讲解uplift建模的几种方法:
T-Learner, S-Learner, 标签转换,Tree-based model

1、T-Model,两个模型求差分

参考文章:Uplift-Model在贝壳业务场景中的实践

T-Learner,也叫T-Model,其中T代表two的意思,也即用两个模型。它的主要思想是对干预数据无干预数据分别进行建模,预估时数据进入两个模型,用两个模型的预测结果做差值,来得到预估的增量。

1)模型原理 & 建模步骤

u p l i f t   s o c r e = τ ( X ) = G T ( Y i ∣ X i ) − G C ( Y i ∣ X

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值