R数据分析：工具变量回归的做法和解释，实例解析

最新推荐文章于 2025-07-22 09:25:31 发布

原创

最新推荐文章于 2025-07-22 09:25:31 发布 · 1.7k 阅读

·

11

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#python #人工智能 #开发语言

前几天看了个视频，是2024年诺贝尔经济学奖得主在分享自己的研究，研究问题是“制度如何形成并影响经济繁荣”，在研究这个问题的时候他的PPT中提到研究的统计过程中用到了工具变量，想着再次大家介绍一下这个方法。说不定利用这个方法，哪天我的读者里面也出个诺贝尔奖得主呢，哈哈哈。

想象一下：你想知道“冰淇淋销量”和“溺水人数”之间是否存在关系。你通过数据发现，冰淇淋销量高的月份，溺水人数也比较多。你可能会得出“吃冰淇淋导致溺水”的结论吗？显然不合理。

问题出在哪里？

这里存在一个“遗漏变量”——气温。

气温升高，人们更喜欢吃冰淇淋，导致冰淇淋销量上升。
气温升高，人们更喜欢去游泳等水上活动，导致溺水人数上升。

所以，冰淇淋销量和溺水人数之间并非直接的因果关系，而是都被气温这个共同的因素所影响。这种因为遗漏变量导致你研究的变量（冰淇淋销量）和影响结果的“其他因素”（这些“其他因素”我们统称为“误差项”）产生关联的情况，就叫做内生性。

内生性指的是，在统计模型中，解释变量（比如“吃冰淇淋”）和误差项（也就是我们没有观测到的其他影响因素）之间存在关联。这会导致模型估计结果产生偏差，我们无法准确地推断出因果关系。

In econometrics, endogeneity refers to the situation where an explanatory variable in a regression model is correlated with the error term

具体来说，内生性通常由以下几种原因引起：

1.遗漏变量（Omitted Variable）： 模型中遗漏了一个或多个与解释变量和因变量都相关的变量。

例子：

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

公众号Codewar原创作者 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。