使用statsmodels分析经济数据中的趋势与周期成分-优快云博客

本文链接：https://blog.youkuaiyun.com/gitblog_01199/article/details/148415495

使用statsmodels分析经济数据中的趋势与周期成分

statsmodels Statsmodels: statistical modeling and econometrics in Python 项目地址: https://gitcode.com/gh_mirrors/st/statsmodels

引言

在经济时间序列分析中，将数据分解为趋势成分和周期成分是一项基础而重要的工作。statsmodels库提供了多种方法来实现这种分解，本文将详细介绍三种常用方法：Hodrick-Prescott(HP)滤波法、带有ARIMA模型的未观测成分模型(UC-ARIMA)以及带有随机周期的未观测成分模型(UC)。

数据准备

我们以美国失业率(UNRATE)数据为例，该数据从1954年1月开始记录。首先需要导入必要的库并加载数据：

import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
import statsmodels.api as sm

from pandas_datareader.data import DataReader

endog = DataReader("UNRATE", "fred", start="1954-01-01")
endog.index.freq = endog.index.inferred_freq

方法一：Hodrick-Prescott(HP)滤波

HP滤波是最常用的趋势-周期分解方法之一，其核心思想是通过优化问题将时间序列分解为趋势成分和周期成分。

对于月度数据，通常设定平滑参数λ=129600：

hp_cycle, hp_trend = sm.tsa.filters.hpfilter(endog, lamb=129600)

HP滤波的优势在于实现简单，计算效率高，适合快速分析。但它的缺点是需要预先设定λ值，且缺乏统计理论基础。

方法二：UC-ARIMA模型

未观测成分模型(UC)将时间序列视为多个不可直接观测成分的组合。UC-ARIMA模型将趋势建模为随机游走过程，而周期成分则用ARIMA模型描述。

模型形式化表示为：

y_t = μ_t + η_t
μ_{t+1} = μ_t + ε_{t+1}
φ(L)η_t = ν_t

其中φ(L)是AR(4)滞后多项式，ε_t和ν_t是白噪声。

实现代码：

mod_ucarima = sm.tsa.UnobservedComponents(endog, "rwalk", autoregressive=4)
res_ucarima = mod_ucarima.fit(method="powell", disp=False)

方法三：带有随机周期的UC模型

这种方法同样基于未观测成分框架，但显式地建模了周期成分。周期被表示为具有随机振幅和相位的正弦波。

模型方程：

y_t = μ_t + η_t
μ_{t+1} = μ_t + ε_{t+1}
η_{t+1} = η_t cosλη + η_t* sinλη + ω̃_t
η_{t+1}* = -η_t sinλη + η_t* cosλη + ω̃_t*

实现代码：

mod_uc = sm.tsa.UnobservedComponents(
    endog,
    "rwalk",
    cycle=True,
    stochastic_cycle=True,
    damped_cycle=True,
)
res_uc = mod_uc.fit(method="powell", disp=False)

结果比较与可视化

将三种方法的结果进行可视化对比：

fig, axes = plt.subplots(2, figsize=(13, 5))
axes[0].set(title="趋势成分")
axes[0].plot(endog.index, res_uc.level.smoothed, label="UC")
axes[0].plot(endog.index, res_ucarima.level.smoothed, label="UC-ARIMA(2,0)")
axes[0].plot(hp_trend, label="HP滤波")
axes[0].legend(loc="upper left")
axes[0].grid()

axes[1].set(title="周期成分")
axes[1].plot(endog.index, res_uc.cycle.smoothed, label="UC")
axes[1].plot(endog.index, res_ucarima.autoregressive.smoothed, label="UC-ARIMA(2,0)")
axes[1].plot(hp_cycle, label="HP滤波")
axes[1].legend(loc="upper left")
axes[1].grid()