时间序列数据集可能包含一种趋势。
序列中的趋势是随着时间的推移不断的增加或减少。能够识别,建模,甚至去除时间序列数据集趋势信息是有益的。
在本教程中,你会发现如何在Python中建模以及去除时间序列数据的趋势信息。
完成本教程之后,你就会知道︰
-
时间序列中可能存在的趋势的重要性和类型以及如何识别它们。
-
如何使用简单的差分方法去除趋势。
-
如何建立线性趋势模型以及去除时间系列数据集中的趋势。
让我们开始吧。
Python中如何使用以及去除时间序列数据的趋势信息
图片来自john78727,保留部分权利
时间序列的趋势
趋势是时间序列水平的长期增加或减少。
“一般来说,不表现为周期性的时间序列的系统变化被称为趋势。”
——第5页,R语言时间序列介绍
识别和理解趋势信息可以帮助提高模型的性能;下面是几点原因︰
-
更快地建模:相关的知识会使模型的选择和评估更为有效。
-
简化问题:我们可以更正或消除趋势来简化建模和改善模型性能。
-
更多的数据:我们可以直接利用趋势信息,或者向模型提供附加信息来提高模型性能。
趋势的类型
趋势的类型有很多。
两种常见的类型是︰
-
确定性趋势:趋势始终如一地增加或减少。
-
随机的趋势:趋势的增加,减少不一致。
一般情况下,确定性趋势更容易识别和消除,但在本教程中介绍的方法还可用于随机趋势。