博客笔记七: [Airbnb] 赢家诅咒在ab test的思考---为什么三个好的假设一起合作不如分开单干效果之和?

本文分析了A/B测试中赢家诅咒现象,即多个实验单独运行效果优于合并后的效果。赢家诅咒源于选择偏差,文章通过例子和公式证明了这一现象,并指出即使在真实效果为正的情况下,测量的总体效果也会被高估。解决方案包括了解并沟通选择过程,设定明确的实验假设和调整偏差方法,强调不应过度依赖p值,应注重统计严谨和实际业务结合。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

原文标题:Selection Bias in Online Experimentation
Thinking through a method for the Winner’s Curse in A/B testing;
原文地址:https://medium.com/airbnb-engineering/selection-bias-in-online-experimentation-c3d67795cceb
作者:Milan Shen

总结:(以后都把总结写在前面)
- 本文先笼统分析为什么几个ab test实验提升效果不如分开时候提升效果之和,然后对于假设选择的偏差进行分析,发现我们很大假设空间选择几个好的肯定会有偏差的,但是在实际工作中要记得把这部分调整消除掉(作者只讲了how to count and remove,没有讲怎么进行实验来消除)
- 不要迷信p值,注意积累
- 统计不行,有些基本的素养都不够;刷完题要多看书多上课呀呀
- 公式证明那一段没给更多说明,觉得有点混沌
- 本文很好,要多看几遍,争取在面试中能够说出来。

1. 问题提出:

几个成功的实验一起apply之后,效果并不是各个效果提升数字之和(7.2%),相反,常常是小于这个和(4%)。澄清:实验的进行不是同时的,而是一个接着一个的。

可能原因:
  • 方差:每个实验数字都有方差,所以减小也在情理之中
  • 季节因素:业务有季节影响,因而不能单单看这两个数字,其实他们来自不同的时间跨度
  • 短期影响和长期影响:和上面一个类似,实验有不同时间跨度,有的刚刚进行的时候效果比较好但是可能时间长了之后效果就减弱了
  • 实验对象有交集:这个比较麻烦,我上的ab test课程上面有。 Even if the estimate in each experiment is unbiased, the effect itself can be different when the sample sizes are at different ratios because of the potential interaction
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值