1.模型介绍
ARIMA,差分自回归滑动平均模型,又称求自回归滑动平均模型,是时间序列预测分析方法之一。
ARIMA(p,d,q)中,AR是“自回归”,p为自回归项数;MA是“滑动平均”,q为滑动平均项数;d是使之成为平稳序列所做的差分次数(阶数)。
2.ARIMA模型运用流程
以《应用系统负载分析与磁盘容量预测》为案例:
- (平稳性检验)根据时间序列的散点图、自相关系数和偏自相关系数、单位根检验(ADF),来判断数据的平稳性;
- (平稳化处理)对非平稳的时间序列数据进行差分处理,得到差分阶数d;
- (白噪声检测)为了验证序列中有用的信息是否已被提取完毕,如果为白噪声序列,说明序列中有用的信息已经被提取完毕,可以采用LB统计量的方法进行白噪声检验;
- (模型识别和定阶)根据所识别出来的特征建立相应的时间序列模型。平稳化处理后,若偏自相关函数是截尾的,而自相关函数是拖尾的,则建立AR模型;若偏自相关函数是拖尾的,而自相关函数是截尾的,则建立MA模型;若偏自相关函数和自相关函数均是拖尾的,则序列适合ARIMA模型。可以采用BIC准则对模型进行定阶,确定p,q参数,从而选择最优模型;
- (模型检验)检验已确定的模型其残差序列是否为白噪声,如果不是白噪声,说明残差中还存在有用的信息,需要修改模型或者进一步提取;
-(模型预测)应用已通过检验的模型进行预测;
3.平稳性检验
(1)看图法