基于滑动窗口的插补方法
在数据处理中,处理右删失数据是一个常见且重要的问题。本文将介绍两种插补方法:CPM插补法和基于滑动窗口的SWPM插补法,并对它们进行比较。
1. 插补方法概述
处理删失数据通常有三种主要方法:
- 直接删除法 :直接从数据库中删除删失点,但这可能会导致结果出现较大偏差。
- 分布替换法 :用删失数据的预测值替换其分布,常用的方法有Kaplan - Meier估计、加权观测法或数据转换法。
- 插补法 :原本主要用于处理缺失数据问题,但对删失数据也非常有用。对于右删失数据,kNN插补法和预测模型插补法常被使用并取得了较好的效果。本文将重点介绍SWPM插补法。
2. CPM插补法
CPM插补法使用普通最小二乘法(OLS)。它仅针对数据集的观测值($t_j$,$j = 1, \cdots, k$,其中$k$为未删失值的数量)估计线性回归模型,然后用样本内估计来插补右删失观测值。
线性回归模型的形式如下:
$t_j^ = v_j^T\beta^ + \varepsilon_j^*$,$j = 1, \cdots, k$
其中,$V_j^T$是$(1 \times p)$维的预测变量向量,$\beta^ = (\beta_0, \beta_1, \cdots, \beta_p)^T$是回归系数向量,$\varepsilon_i^ \sim N(0, 1)$是CPM的随机误差项。
回归系数向
超级会员免费看
订阅专栏 解锁全文
907

被折叠的 条评论
为什么被折叠?



