一、目标
给出2013年7月1号到2014年8月31号所有用户在该时期内资金的申购信息,预测2014年9月1号到31号每天的申购总额
二、建模流程
1.整合原始信息,将原始数据按天分组并计算日申购总量,并绘制时序数据的ADF图,通过观察时序图,发现数据是非平稳时间序列,接下来进行验证
2.进行单位根平稳检验,p-value>0.05,确定该数据是非平稳时间序列
3.进行白噪声检验,p-value<0.05,排除白噪声
4.将非平稳序列转化为平稳序列:
1.对非平稳时间序列进行时间序列的差分
2.画出差分后的自相关和偏自相关图像
3.循环上述步骤,至找到适合的差分次数d的值,此处选的1阶差分
5.查找ARIMA模型中合适的p值和q值:
1.画出一阶差分的自相关和偏自相关图,通过观察图像选取p值和q值
2.将选出来的p值和q值组合起来建立多个ARMA模型,并分别进行拟合
3.通过分析模型效果,找出最佳模型,确定p、q值
6.进行模型检验
1.对ARMA(p,q)模型所产生的残差做自相关图
2.接着做德宾-沃森(D-W)检验,得出结论:数据不存在自相关性
3.绘制qq图观察残差是否符合正态分布:否
7.构建ARIMA模型,进行预测
Notes:
1.关于是否平稳的判断:
APF-自相关性系数:一个平稳时间序列,自相关系数(ACF)会快速的下降到接近 0 的水平,然而非平稳时间序列的自相关系数会下降的比较缓慢;同样的,非平稳时间序列的自相关系数通常非常大并且为正值。