2020年淘宝双十一成交额4982亿,要知道2019年是2684亿,猛地一瞅,好牛,但总量越来越大的同时增长率却逐年降低呀,且今年的统计口径和历年都不一样(后面会说统计口径的问题)。
其实早在2019年双十一前,网友们就开始讨论双十一数据造假的问题了,有网友对历年数据进行拟合并且成功预测19年的成交额,结果都高度吻合。
今天我们主要是借着双十一成交额这个数据来聊一聊时间序列分析的问题
时间序列,顾名思义,就是数据随时间变化
时间序列进行预测的关键,是确定已有时间序列的变化模式,并假定这种模式会延续到未来
名词解释
时间序列:数据随时间变化的形式
经济数据大多呈时间序列的形式,如历年淘宝双十一成交额
一个时间序列的变化通常可以由以下4种成分组成:
- 趋势:时间序列呈现的某种持续上升/下降的变化。趋势可以是线性的,也可以是非线性的。
想要确定一个时间序列是否包含趋势成分,可对数据进行回归分析,得到拟合的趋势线,并进行显著性检验,通过检验,则说明线性趋势显著
- 季节性:时间序列在一年中出现的