平稳时间序列的大样本OLS回归

该博客探讨了在平稳时间序列背景下,如何运用大样本OLS回归进行分析。文章介绍了必要的记号与假设,包括遍历平稳性、线性性等,并通过定理阐述了回归参数估计量的性质及渐近分布。此外,还详细讨论了条件异方差和同方差情况下的假设检验方法。

有了《独立同分布的大样本OLS回归》的铺垫,现在进一步将OLS推广到平稳时间序列的情况。

思路还是一样:

  • 进行点估计,再研究估计量的性质;
  • 构造统计量,在大样本下推导其渐近分布,并进行假设检验

这里的各种计算与上一篇非常像,需要注意的是大数定律和中心极限定理在这里的使用条件(遍历平稳、鞅差分过程等)与上一篇不同,因此也需要不同的假设。

1 记号与假设

Q = E ( x t x t ′ ) Q=\text{E}(x_t x_t') Q=E(xtxt) V = Var ( x t ε t ) V=\text{Var}(x_t\varepsilon_t) V=Var(xtεt)

  • 假设1 遍历平稳性(Ergodic stationary) { x t ′ , y t } ′ \{x_t',y_t\}' { xt,yt} t = 1 , … , N t=1,\ldots,N t=1,,N是可观测的遍历平稳过程;
  • 假设2 线性性 y t = x t ′ β + ε t y_t=x_t'\beta+\varepsilon_t yt=xtβ+εt,可写作矩阵形式 y = X β + ε y=X\beta+\varepsilon y=Xβ+ε
  • 假设3 模型正确设定 E ( ε t ∣ x t ) = 0 \text{E}(\varepsilon_t|x_t)=0 E(εtxt)=0 E ( ε t 2 ) = σ 2 < ∞ \text{E}(\varepsilon_t^2)=\sigma^2<\infty E(εt2)=σ2<
  • 假设4 非奇异性 K × K K\times K K×K矩阵 Q Q Q是对称、有限、非奇异的;
  • 假设5 鞅差分:相对于 { x s ε s , s < t } \{x_s \varepsilon_s, s\lt t\} { xsεs,s<t}
    生成的 σ \sigma σ-域, { x t ε t } \{x_t \varepsilon_t\} { xtεt}为一鞅差分序列,且 K × K K\times K K×K矩阵 V V V是对称、有限、正定的;
  • 假设6 条件同方差 E ( ε t 2 ∣ x t ) = σ 2 \text{E}(\varepsilon_t^2|x_t)=\sigma^2 E(εt2xt)=σ2

假设1包含了上一篇中的独立同分布过程。由于不再是在独立同分布假设下,因此严格外生性 E ( ε t ∣ X ) = 0 \text{E}(\varepsilon_t|X)=0 E(εtX)=0不一定可以满足。假设3允许 x t x_t xt包含前定变量(predetermined variables)如滞后的因变量 y t 1 y_{t_1} yt1等,另外,由于有假设3的保证, V = Var ( x t ε t ) = E ( x t x t ′ ε t 2 ) V=\text{Var}(x_t\varepsilon_t)=\text{E}(x_t x_t' \varepsilon^2_t) V=Var(xtεt)=E(xtxtεt2)

2 一些定理

定理1 遍历平稳随机样本的弱大数定律:假设 { Z t } t = 1 n \{Z_t\}_{t=1}^n { Zt}t=1n为遍历平稳过程, E ( Z t ) = μ \text{E}(Z_t)=\mu E(Zt)=μ E ( ∣ Z t ∣ ) < ∞ \text{E}(\vert Z_t\vert)<\infty E(Zt)

### 实现长时间序列数据的多元回归分析 在 ArcGIS 中处理长时间序列数据并执行多元回归分析涉及多个方面的工作流程。地理加权回归 (GWR) 工具可以用于探索空间变化关系,而普通最小二乘法(OLS) 则适合于全局模型构建[^1]。 对于时间维度的数据集,在准备阶段需确保每个观测点的时间戳准确无误,并按照时间顺序排列好属性表中的记录。如果存在缺失值或者异常值,则应该提前清理这些不良数据以提高后续统计的有效性和可靠性[^2]。 当准备好输入要素类之后,可以选择适用 OLS 或 GWR 方法来拟合线性方程。通过【ArcToolbox】> 【Spatial Statistics Tools】> 【Modeling Spatial Relationships】找到对应的工具选项卡。设置因变量字段、自变量字段以及其他参数配置项完成建模过程[^3]。 值得注意的是,在解释结果之前要检查诊断指标如 R 平方、调整后的 R 平方、AICc 值等评估模型性能;同时也要关注残差图是否存在模式化趋势表明可能违反了某些假设条件。另外还需考虑多重共线性的可能性及其影响程度[^4]。 ```python import arcpy from arcpy import env env.workspace = "C:/data" arcpy.CheckOutExtension("spatial") # Example of running Ordinary Least Squares regression analysis. ols_result = arcpy.stats.OrdinaryLeastSquares( Input_Features="crime_data.shp", Unique_ID_Field="UniqueID", Output_Feature_Class="output_ols.shp", Dependent_Variable="ViolentCrimesPerPop", Explanatory_Variables=["PctNotHSGrad", "PctUnemployed"], Coefficient_Output_Table="coefficients.dbf", Diagnostic_Output_Table="diagnostics.dbf" ) print(arcpy.GetMessages()) ``` #### 注意事项: - 数据预处理非常重要,特别是针对具有不同尺度单位的预测因子应当标准化或归一化; - 如果样本量较小可能导致估计偏差增大,因此建议收集尽可能多的历史观察资料; - 对于非平稳特性明显的时空现象可尝试引入滞后效应或其他改进措施提升拟合精度; - 使用前应充分理解所选方法背后的理论基础以便合理解读输出成果意义所在[^5]。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值