因果关系与时间序列:计量经济学家的贝叶斯之路
1. 公平性分析与因果推断
在进行因果推断时,公平性是一个重要的话题。我们不能仅仅基于对观测数据(如调查数据)的简单统计分析就对性别差距等类似效应下结论,因为结构方面在公平性分析中至关重要,忽略它几乎肯定会导致无效结果,如符号反转、效应掩盖或产生不存在的效应。
在自然语言处理(NLP)与因果关系的交叉领域,我们从路德维希·维特根斯坦的思想出发,探讨了这些思想如何有助于计算机高效编码自然语言。接着,我们深入研究了NLP与因果关系交叉时遇到的三种场景:文本作为处理因素、文本作为结果以及文本作为混杂因素。并展示了如何使用基于Transformer的CausalBert模型,在文本作为混杂因素的场景中调整文本嵌入以进行因果推断。最后,我们讨论了使用该模型时可能遇到的局限性和潜在挑战。
2. 准实验方法概述
随机对照试验(RCT)通常被认为是因果推断的“黄金标准”,但在某些情况下我们无法进行RCT。然而,存在一类广泛的情况,我们可以观察到自然发生的干预,这些干预无法控制或随机化,这类事件有时被称为自然实验。用于分析自然实验数据的一类方法被称为准实验方法,传统上准实验被视为时间序列问题,即观察某个时间点发生的事件,并跟踪某个可测量的量在事件发生后与某个基线相比的变化。
2.1 以Twitter收购为例
2022年10月27日,埃隆·马斯克收购了社交媒体平台Twitter,收购过程漫长且充满争议。10月28日,马斯克发推文称“鸟儿自由了”,这条推文迅速引起了公众和媒体的关注。为了探究这次收购是否改变了人们的谷歌搜索模式,我们将查看谷歌趋势数据,比较马斯克推文前后用户搜索Twitte
超级会员免费看
订阅专栏 解锁全文
646

被折叠的 条评论
为什么被折叠?



