时间序列与因果关系分析:以气候变化为例
1. 格兰杰因果关系理解
在分析数据关系时,我们常常会遇到一些问题,比如新药处方数量和总处方数量之间有什么关系?或者大宗商品价格(如铜价)是否是美国股市价格的领先指标?格兰杰因果关系为我们提供了一种方法,用于判断两组时间序列数据中,一组数据是否可能影响另一组数据的变化。
具体做法是,创建两个用于预测 $y$ 的模型:
- 模型 $\Omega$:仅使用 $y$ 的过去值。
- 模型 $\pi$:使用 $y$ 和 $x$ 的过去值。
通过比较这两个模型的残差平方和(RSS),并使用 F 检验来判断嵌套模型 $\Omega$ 是否足以解释 $y$ 的未来值,还是完整模型 $\pi$ 更好。F 检验的原假设 $H_0$ 和备择假设 $H_1$ 如下:
- $H_0$:对于每个 $i \in [1,k]$,$\alpha_i = 0$,即不存在格兰杰因果关系。
- $H_1$:至少存在一个 $i \in [1,k]$,使得 $\alpha_i \neq 0$,即存在格兰杰因果关系。
本质上,我们是在判断从统计学角度,$x$ 是否比仅使用 $y$ 的过去值能提供更多关于 $y$ 未来值的信息。需要注意的是,这里并非要证明实际的因果关系,只是表明两个值之间存在某种关联。同时,我们还需要反向运行该模型,以验证 $y$ 是否不会为 $x$ 的未来值提供信息。如果是这种情况,可能存在某个外生变量 $Z$ 需要进行控制,或者它可能是格兰杰因果关系的更好候选变量。
2. 确定合适的滞后结构
确定合适的滞后结构有几种不同的方法:
-
超级会员免费看
订阅专栏 解锁全文
22

被折叠的 条评论
为什么被折叠?



