
因果推断
文章平均质量分 90
瑞行AI
这个作者很懒,什么都没留下…
展开
-
因果推断与增益模型概述
增益模型(uplift model),主要用于建模干预对客户响应的增量效果。本文内容参考论文《Causal Inference and Uplift Modeling - A review of the literature》,对增益模型的相关建模和评估方法进行总结。基于鲁宾因果模型框架,对三类增益模型方法进行比较:(1.)Two-Model方法(2.)Class Transformation方法(3.)直接建模增益方法。原创 2025-01-02 13:51:13 · 1072 阅读 · 0 评论 -
因果推断建模方法总结
本文主要总结常见因果推断模型方法,既包括处理二元干预的建模方法,也包括处理更复杂干预的建模方法。相关内容主要参考论文《Causal Inference with Complex Treatments: A survey》。原创 2024-12-26 12:25:14 · 1346 阅读 · 0 评论 -
Uplift Model:T-Learner类增益模型实战
T-Learner增益模型方法,也就是Two models approach。python的scikit-uplift包实现了相应sklift.models.TwoModels算法类,基础版本是vanilla方法。具体步骤参考上图公式:训练时,利用treatment组个体,训练treatment模型,利用control组个体,训练control模型;预估时,将测试个体特征分别喂入treatment模型和control模型,得到两个预测概率做差,即是这组个体的uplift。原创 2024-12-23 13:01:04 · 1194 阅读 · 0 评论 -
Uplift Model:S-Learner类增益模型实战
S-Learner增益模型方法,也叫Treatment Dummy approach, 或者 Single model approach。以二元干预为例说明:训练时,通过一个模型学习treatment组和control组的个体,把取值1或者0的“干预标记”作为一列特征,与其余特征一起喂入模型;预测时,对同一个个体,分别让干预标记列取值1或者0,得到两个预测值,二者相减就是有干预相对无干预的增益值。原创 2024-12-20 12:46:41 · 949 阅读 · 0 评论 -
Class Transformation Model增益模型
本文要讲述的增益模型类别是Class Transformation Model,即类转换模型,该模型主要应用于二元因果分类问题,即干预和结果都是二元变量。类转换模型的主要思想是通过对结果变量做变换,将Uplift模型预估任务 转化为一个分类任务。下面主要给出两个版本的类转换模型的理论推导:(1.)等分随机版本(2.)倾向分修订版本。原创 2024-12-19 00:34:01 · 434 阅读 · 0 评论 -
Uplift模型评估指标AUUC
因果推断技术在营销场景的主要应用就是基于Uplift Model来预测营销干预对个体转化概率的增益,通过增益大小识别营销敏感人群。增益大小,就是计算有干预 相对无干预的转化概率差异,即个体因果效应ITE。原创 2024-12-17 09:10:51 · 1191 阅读 · 0 评论 -
潜在结果框架:因果推断世界里的平行时空
潜在因果框架(Potential Outcome Framework,POF)是由Donald Bruce Rubin提出的一种针对观测数据进行因果推断的框架,也被称为鲁宾因果模型(Rubin Causal Model)。“潜在结果”指的是在特定干预下,个体可能产生的结果。叫“潜在结果”的原因是该结果并不一定能观测到,它只是选择是否接受干预处理后对应的一个潜在数值。而作出是否接受干预处理的选择后,观测不到的结果称为“反事实结果”。叫“反事实结果”的原因是该结果无法观测到,并不是实际发生的。原创 2024-12-03 07:35:45 · 906 阅读 · 0 评论 -
Uplift Tree Model:增益树模型原理
相比T-Learner/S-Learner这种间接建模增益的元学习类模型,可以利用决策树直接预估单干预下的增益。通过决策树建模干预增益,最关心的问题是“树的分裂规则”。传统的决策树分类模型,训练时的分裂标准是信息增益或信息增益比。对于二分类问题,训练过程树分裂标准是节点分裂后,子节点的纯度变得尽可能高,即区分出各类样本。原创 2024-12-02 18:47:26 · 988 阅读 · 0 评论 -
厘清标准差和标准误:因果推断的统计学基础
准差,指 一次抽样中 个体取值间的离散程度,反映了 个体取值对样本均值的代表性。标准误,指 多次抽样中 样本均值间的离散程度,反映了 样本均值对总体均值的代表性。原创 2024-11-15 11:01:01 · 1075 阅读 · 0 评论 -
一文掌握方差分析:因果推断的统计学基础
方差分析,用于比较「类别型特征」的不同分类在「连续型特征」上的均值,是否存在显著差异。原创 2022-07-28 13:52:08 · 1140 阅读 · 1 评论 -
揭秘均值抽样分布:因果推断的统计学基础
从同一个总体中随机抽取多个样本(每个样本包含的个体数量相同,记为“样本容量n”),计算每个样本包含的个体在某个特征的均值,这些均值形成的分布就是均值抽样分布。然后,根据下表的各组均值取值,在坐标轴上相应取值上计数,比如,18出现一次相应刻度的高度就是1,19出现两次相应刻度的高度就是2,以此类推,得到相应均值抽样分布的柱状图。在实际情况中,一般不知道总体分布情况,要求n>=30,这时,才有可能让中心极限定理成立。对于一个分布未知的总体,可以对该总体进行抽样,根据抽样样本推断该总体的分布。原创 2024-11-13 13:53:13 · 624 阅读 · 0 评论