时间序列及异常检测综述(资料)

1. 背景

时间序列数据(time series data)是在不同时间上收集到的数据,用于描述现象随时间变化的情况。时间序列是一种典型的数据,具有随时间变化的特征。在大多数场景中,都能见到的一种数据类型。如客流数据,股票数据,销售额数据,网络日志,某些KPI指标等等内容。
时间序列数据格式:(单变量)

Time Value
2018-11-01 2222
2018-11-02 3241
2018-11-03 4232

… …

2. 时间序列预测方法

首先我们要有个目标,想通过时间序列数据完成什么样的目标,短期、中期、长期预测,单步、多步,单变量,多变量。然后需要尽可能的收集时间序列数据,数据越多,能够发现更多数据特征,预测会更准确。
时间序列需要对数据中的缺失、异常、范围等进行处理。并且如何可以将预测问题转换为分类问题,则预测的难点会大大降低。
常见的时间序列数据预测方法,主要总结一下几种:

  • 简单平均法
  • 移动平均法
  • 指数平均法
  • ARIMA法
  • Prophet法
  • 线性回归、KNN等机器学习算法
  • LSTM等深度学习算法

下面主要对其中几种方法进行介绍,其他方法提高参考链接,可自行学习。

3. ARIMA

ARIMA模型全称为自回归移动平均模型(Autoregressive Integrated Moving Average Model,简记ARIMA),其中ARIMA(p,d,q)称为差分自回归移动平均模型,AR是自回归, p为自回归项; MA为移动平均,q为移动平均项数,d为时间序列成为平稳时所做的差分次数。
注意:ARIMA模型只适用于单变量时序预测。

3.1 ARIMA模型预测的流程

1)根据时间序列的散点图、自相关函数和偏自相关函数图以ADF单位根检验其方差、趋势及其季节性变化规律,对序列的平稳性进行识别。一般来讲,经济运行的时间序列都不是平稳序列。
2)对非平稳序列进行平稳化处理。如果数据序列是非平稳的,并存在一定的增长或下降趋势,则需要对数据进行差分处理,如果数据存在异方差,则需对数据进行技术处理,直到处理后的数据的自相关函数值和偏相关函数值无显著地异于零。
3)根据时间序列模型的识别规则,建立相应的模型。若平稳序列的偏相关函数是截尾的,而自相关函数是拖尾的,可断定序列适合AR模型;若平稳序列的偏相关函数是拖尾的,而自相关函数是截尾的,则可断定序列适合MA模型;若平稳序列的偏相关函数和自相关函数均是拖尾的,则序列适合ARMA模型。
4)进行参数估计,检验是否具有统计意义。
5)进行假设检验,诊断残差序列是否为白噪声。
6)利用已通过检验的模型进行预测分析。

3.2 学习资料

针对每一部分,参考的学习链接如下:
Gitlab:

评论 6
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Great1414

整理不易,谢谢支持

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值