时间序列数据的平稳性对于我们采用什么样的分析方式、选择什么样的模型有着至关重要的影响。
我们想一下,假如一个时间序列的波动趋势从来没有稳定过,那么它每个时期的波动对于之后一段时期的影响都是无法预测的,因为它随时可能“变脸”。而当一个时间序列的特征维持稳定,比如它的均值和方差是稳定的,那么我们认为在之后的一段时间里,它的数据分布跟历史的数据分布大概率是保持一致的,这时,我们就可以基于历史数据对未来的走势做一个预测,这能帮助我们找到更大概率成功的决策。
股票数据,就是极为常见的一种时间序列数据。在量化过程中应用时间序列分析手段时,我们往往需要先进行平稳性检验,从而选择合适的研究方法。
在学习平稳性之前,我们先了解一下自相关性的概念。
一、自相关性
自相关性与相关性
我们知道,相关性常用于统计两个变量之间是否存在某种关联。那么,自相关性代表了变量与自身之间的相关性,只不过一般情况下我们统计的是两组隶属于不同时间区间的数据。当两组数据的时间范围相同时,其相关性为1(相当于两组完全相同的数据)。
之前我们曾经学习过Pearson相关系数,自相关系数的计算和Pearson相关系数的计算过程非常相似,但是它们在分母上有些区别。Pearson相关系数的计算中,分母为两个变量的标准差之积;而在自相关系数的