工具变量原理

在做回归时,很多时候会有 E ( x t ε t ) ≠ 0 \text{E}(x_t \varepsilon_t)\neq 0 E(xtεt)=0的情况,这也意味着不满足外生性条件 E ( ε ∣ X ) = 0 \text{E}(\varepsilon|X)=0 E(εX)=0,此时的OLS估计量 β ^ \hat\beta β^就不再满足无偏性,并且随着 n n n的变大,它的bias也无法变小。若对此无法理解,请先掌握《小样本OLS回归梳理》中的内容。

此时该怎么办?一种解决方法是利用一些与 ε \varepsilon ε无关的变量,这就是工具变量(instrumental variables,下文统称IV)。我们假设找到的IV是一些 l × 1 l\times 1 l×1的向量 z t z_t zt,再将它排成 n × l n\times l n×l的矩阵 Z = [ z 1 , ⋯   , z n ] ′ Z=[z_1,\cdots,z_n]' Z=[z1,,zn]

IV需要与原来的 x t x_t xt足够接近,因此 Z ′ X Z'X ZX X X X n × k n\times k n×k矩阵)必须满列秩。而我们寻找IV的目的,就是要让IV满足 E ( z t ε t ) = 0 \text{E}(z_t\varepsilon_t)=0 E(ztεt)=0,由数据生成过程 ε t = y t − x t ′ β o \varepsilon_t=y_t-x'_t\beta_o εt=ytxtβo可知,我们要求解的就是满足 E ( z t ( y t − x t ′ β o ) ) = 0 \text{E}(z_t(y_t-x'_t\beta_o))=0 E(zt(ytxtβo))=0 β o \beta_o

### 使用 `ivprobit` 进行工具变量检验的方法 #### ivprobit 的基本原理 当处理二元因变量模型时,如果存在内生解释变量,则可以采用工具变量方法来解决潜在的偏差问题。对于 Probit 模型中的内生性问题,Stata 提供了专门命令 `ivprobit` 来执行此类分析[^1]。 #### 执行 ivprobit 命令的具体语法结构 在 Stata 中应用 `ivprobit` 需要指定被解释变量、外生协变量以及至少一个用于识别方程组的有效工具变量。具体来说: ```stata ivprobit y (endogvar = instvars) exogvars, vce(vcetype) ``` 其中: - `y`: 被解释的二分响应变量; - `(endogvar=instvars)`:括号内的部分定义了内生回归量及其对应的工具变量列表; - `exogvars`: 外生控制变量集合; - `vce(vcetype)` : 可选参数设置标准误计算方式(如稳健型); #### 实际案例操作展示 假设研究者想要评估教育年限对个人是否参加工作的概率影响,并怀疑家庭背景可能造成样本选择偏误从而使得教育成为内生因素。此时可利用父母受教程度作为工具变量来进行如下实证分析: ```stata use "laborsupply.dta", clear ivprobit work (educ=fatheduc motheduc) exper expersq, robust estat firststage predict pwork, pr summarize pwork ``` 上述代码片段展示了完整的流程,包括加载数据集、运行带有工具变量的概率单位回归(`ivprobit`)并加入稳健的标准误差选项、报告第一阶段的结果以验证工具强度、最后预测工作参与的可能性并查看统计描述。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值