复杂AB实验

Coco-Lele

已于 2022-08-01 20:16:06 修改

阅读量1k

点赞数

文章标签：机器学习人工智能

于 2022-08-01 00:49:35 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/yike330/article/details/126055204

版权

本文探讨了AB测试的基本问题，包括检验指标分类、多天累计值的计算，以及在不能进行AB实验的情况下如何处理。重点介绍了delta检验、贝叶斯检验和不同假设检验如z检验、t检验、F检验和卡方检验的应用。同时，讨论了当AB实验结果不显著时的解决策略，并提到了DID方法和平行趋势检验。内容涵盖了AB实验的完整流程和关键概念。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1. 基本问题

检验指标分类

AB测试的检验指标可以分为两大类：绝对值指标、比例值指标。两者的方差计算方式不同。
其中比例值根据分母不同又可分为两类：分母为人次（留存率、转化率等）、分母为行为次数（曝光点击率）。
分母为人次，分流单位和分析单位相同，可以用 $z$ 检验；分母为行为次数，分析单位之间不独立，要用 $d e lt a$ 检验。

多天累计值

将指标在多天的表现累计合并计算。比如某行为的人均次数，则分母是实验期间该行为的总次数，分子是实验期间进组的去重人数。

优点：保证样本之间独立；增加样本量，显著性可以随着累积而增加。

留存率的多天累计：分天计算每天新进组人的留存率，再根据人数加权。

不能用AB的情况

不能控制干预变量时（比如看直播对用户的影响，不能强制一部分人看，一部分人不看）
所占用流量过多
策略可能损害用户体验

AB实验步骤

确定实验策略；制定实验的观察指标；计算样本量（显著性水平/统计功效/需要观察到的指标最小提升水平/指标方差）；实验开发上线；数据回收。

AB不显著

是否达到最小样本量
DID消除固定差异
检查实验链路，看是否所有人都被策略触达（渗透率低，可以PSM）

2. delta检验

见上篇，适用于分流单元和分析单元不同的情况。

3. 贝叶斯检验

优点：

不需要考虑样本量。
可以得到后验参数的分布，进而量化指标提升的概率、指标提升的大小。

贝叶斯派 VS 频率派基本理论：

先验分布 $\pi(\theta)$ + 样本数据 $P(X|\theta)$ = 后验分布 $\pi(\theta|X)$

共轭先验分布：贝塔分布与二项分布

$\theta$

最低0.47元/天解锁文章

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。