1.AR(Autoregressive)模型
自回归模型描述的是当前值与历史值之间的关系。参数代表了波动系数,跟前一时间的变化。
2.MA(Moving average)模型
滑动平均模型描述的是自回归部分的误差累计(波动误差的关系)
3.ARMA模型
AR与MA 的结合:ARMA(p,q),p和q分别为AR和MA的阶数
4.平稳性
ARMA的模型要求时间序列是平稳的。
一个时间序列,如果均值没有系统的变化(无趋势)、方差没有系统变化,且严格消除了周期性变化,就称为平稳的。(可以有变化,但必须是无规律的小变化)
5.差分
时间序列t时刻的值和t-1时刻的值差d构造的新序列为一阶差分。再对其进行相同的差分运算,可以得到二阶差分。
通常非平稳的序列可以经过d阶差分得到弱平稳或近似弱平稳的时间序列。
ARIMA(p,d,q)模型:p为自回归滞后项,q阶滑动平均滞后项,d阶差分。
6.相关系数
反应两个空间中两个向量之间相关关系密切程度的统计指标。
7.自相关函数(ACF)
某随机信号再不同时刻的取值之间的相关程度。
8.偏自相关函数(PACF)
阶次为s的偏自相关:去除信号中所有滞后期小于s的信号影响后,当前信号与滞后s阶的信号之间的关系。
9.ARIMA模型参数选择
9.1.检查序列是否平稳
若不平稳,使用差分平稳化序列,确定差分阶数d
9.2.ARMA定阶
通过PACF确定AR的阶数p
通过ACF确定MA的阶数q
9.3 根据参数p,d,q建立模型ARIMA(p,d,q)
10.案例:股票数据分析
10.1 步骤
准备数据、可视化数据审查数据、处理数据、根据ACFPACF定阶、拟合ARIMA模型、预测
10.2 代码及注释
# -*- coding: utf-8 -*-
import pandas as pd
import pandas_datareader
import datetime
import matplotlib.pylab as plt
from matplotlib.pylab import style
from statsmodels.tsa.arima_model import ARIMA
from statsmodels.graphics.tsaplots import plot_acf, plot_pacf
style.use('ggplot') # 设置图片显示的主题样式
# 解决matplotlib显示中文问题
plt.rcParams['font.sans-serif'] = ['SimHei'] # 指定默认字体
plt