评估部分线性模型中惩罚和非惩罚估计器的相对性能
1. 引言
半参数模型近年来在统计及相关领域备受关注。在这类模型中,平均响应与部分协变量呈线性关系,而与其他变量的关系则由非参数函数描述,因此比参数模型更具灵活性。部分线性模型(PLMs)是应用最广泛的半参数模型之一。过去几十年,人们对PLM的兴趣显著增长。
部分线性回归模型的表达式为:
[y_i = x_i^T \beta + g(t_i) + \varepsilon_i , i = 1, \ldots, n.]
其中,(y_i) 是响应变量,(x_i = (x_{i1}, \ldots, x_{ip})^T) 是 (p) 维协变量,(\beta = (\beta_1, \ldots, \beta_p)^T) 是未知参数向量,(t_i) 是非参数协变量效应,且假设 (0 \leq t_1 \leq \ldots \leq t_n \leq 1),(g(.)) 是光滑函数。误差项 (\varepsilon_i) 独立同分布,均值为 0,方差为 (\sigma^2)。
在实际应用中,多个预测变量很常见。有些对整体预测有显著贡献,而有些贡献很小或没有贡献,可以忽略。通常假设可以通过先验信息或变量选择技术检测出显著预测变量。参数向量 (\beta) 被划分为 (\beta = (\beta_1^T, \beta_2^T)^T),其中 (\beta_1) 是显著预测变量的系数向量,(\beta_2) 是非显著预测变量的系数向量。这里,(\beta_1) 和 (\beta_2) 的维度分别为 (p_1) 和 (p_2),且 (p_1 + p_2 = p)。有两个模型可供考虑:包含所有 (p) 个预测变量的全模型和仅包含 (
超级会员免费看
订阅专栏 解锁全文
2783

被折叠的 条评论
为什么被折叠?



