时间序列与因果关系分析:以气候变化为例
1. ARIMA模型与季节性
ARIMA模型能够纳入季节性因素,包含自回归、差分和移动平均项。非季节性ARIMA模型通常用 (p,d,q) 表示。对于季节性ARIMA模型,假设数据是月度数据,其表示方法为 (p,d,q) x (P,D,Q)12,其中的“12”考虑了月度季节性。在我们使用的R包中,R会自动识别是否应包含季节性因素,若包含,也会纳入最优项。
2. 理解格兰杰因果关系
格兰杰因果关系用于判断两组时间序列数据中,一组数据是否可能影响另一组数据的变化。假设有两组时间序列数据x和y,通过创建两个预测y的模型来实现:
- 模型Ω:仅使用y的过去值进行预测。
- 模型π:使用y和x的过去值进行预测。
然后比较两个模型的残差平方和(RSS),并使用F检验来确定嵌套模型(Ω)是否足以解释y的未来值,还是完整模型(π)更好。F检验的原假设和备择假设如下:
- H0: αi = 0 (对于每个 i ∊[1,k]),不存在格兰杰因果关系。
- H1: αi ≠ 0 (至少存在一个 i ∊[1,k]),存在格兰杰因果关系。
本质上,我们是在判断从统计角度看,x是否比仅使用y的过去值能提供更多关于y未来值的信息。需要注意的是,这里并非要证明实际的因果关系,只是表明两个值之间存在某种关联。为避免虚假结果,该方法应应用于平稳时间序列。
确定合适的滞后结构有几种方法:
- 暴力测试:逐个测试所有合理的滞后项。
- 基于领域专业知识或先前研究的理性直觉来选择滞后项。
- 使用向量自回归(VAR)来确定具有最低信息准则(如赤池信息
超级会员免费看
订阅专栏 解锁全文
1630

被折叠的 条评论
为什么被折叠?



