时间序列数据的统计分析与预测
1. 平稳性检验
在时间序列数据的统计分析中,数据可分为平稳和非平稳两类。平稳时间序列数据的统计特性随时间保持恒定,而非平稳时间序列数据的统计特性则会随时间变化,这可能是由于趋势、季节性、单位根的存在或三者的综合影响。使用非平稳数据进行建模可能会产生虚假回归,因此需要将非平稳数据转换为平稳数据以获得一致且可靠的结果。
我们可以使用ADF(Augmented Dickey - Fuller)检验来检查数据是否平稳。 statsmodels.tsa.stattools 模块中的 adfuller 方法会返回一个包含七个值的元组,我们主要关注第一个、第二个和第五个值,它们分别是检验统计量、p值和临界值字典。
from statsmodels.tsa.stattools import adfuller
result = adfuller(df_settle)
print('ADF statistic: ', result[0])
print('p-value: %.5f' % result[1])
critical_values = result[4]
for key, value in critical_values.items():
print('Critical value (%s): %.3f' % (key, value))
如果ADF检验统计量的值大于临界值(特别是5%的临界值),且p值大于0.05,我们就不能拒绝存在单位根的原假设,认为数据是非平稳的。
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



