移动健康中的迁移学习:TransFall框架解析
1. 标签估计
1.1 基本概念
给定转换后的目标数据集 $\tilde{X}_t$ 和权重因子 $\beta$(它使用源数据集 $X_s$ 来近似 $\tilde{X}_t$ 的分布),标签估计模块旨在为 $\tilde{X}_t$ 估计标签集 $\hat{Y}_t$,以便使用 ${X_t, \hat{Y}_t}$ 为目标平台训练活动识别模型。由于垂直转换模块仅作用于 $X_t$ 的列变量而非行,所以 $X_t$ 和 $\tilde{X}_t$ 中数据样本的顺序相同,为 $\tilde{X}_t$ 估计的标签集 $\hat{Y}_t$ 可直接用于标记原始目标数据集 $X_t$。
1.2 优化问题的推导
为了最小化所有 $x_i \in \tilde{X} t$ 时 $f(x_i)$ 和 $y_i$ 之间的总体估计误差,我们将式 (11.2) 重写为:
$$
\min {f} \sum_{i=1}^{N_s} |y_i - \beta(x_i)f(x_i)|, \quad x_i \in X_s
$$
使用加权最小均方(LMS)拟合技术和 2 - 范数正则化项,可将上述优化问题重写为:
$$
\min_{f} \sum_{i=1}^{N_s} \beta_i (y_{s_i} - f(x_{s_i}))^2 + \lambda |f|^2
$$
然而,式 (11.11) 中的最优函数 $f$ 不一定是线性模型。根据表示定理,可将其转换为线性模型形式。