时间序列分析与预测:ARIMA模型详解
1. ARIMA模型基础
ARIMA(Autoregressive Integrated Moving Average)模型是一类用于分析和预测时间序列数据的统计模型。它通过描述数据中的自相关性来实现这一目标,是简单ARMA模型的扩展。其额外的积分组件旨在确保序列的平稳性,因为与指数平滑模型不同,ARIMA模型要求时间序列是平稳的。
ARIMA模型由以下几个部分组成:
- AR(自回归)模型 :利用观测值与其p个滞后值之间的关系。在金融领域,自回归模型试图解释动量和均值回归效应。
- I(积分) :指对原始时间序列进行差分(将当前时期的值减去上一时期的值),使其平稳。负责积分的参数是d(称为差分阶数),表示需要应用差分的次数。
- MA(移动平均)模型 :利用观测值与白噪声项(过去q个观测值中出现的冲击)之间的关系。在金融领域,移动平均模型试图解释影响观测时间序列的不可预测冲击(在残差中观察到),如自然灾害、与特定公司相关的突发新闻等。MA模型中的白噪声项是不可观测的,因此不能使用普通最小二乘法(OLS)来拟合ARIMA模型,而必须使用迭代估计方法,如最大似然估计(MLE)。
这些组件组合在一起,通常用ARIMA(p, d, q)表示。一般来说,应尽量使ARIMA参数的值尽可能小,以避免不必要的复杂性并防止过拟合训练数据。一个经验法则是保持d <= 2,而p和q不应高于5。此外,模型中很可能其中一个项(AR或MA)占主导地位,导致另一个参数的值相对较小。
超级会员免费看
订阅专栏 解锁全文
980

被折叠的 条评论
为什么被折叠?



