迁移学习:场景、自学习与多任务学习
1. 传统机器学习与迁移学习对比
在传统机器学习中,针对不同的数据源(数据和标签)需要学习不同的模型。对于带有训练数据和标签的源(任务或领域),系统学习的模型(如模型 A 和模型 B)仅对与源相似的目标(任务或领域)有效。大多数情况下,为特定源学习的模型无法用于不同目标的预测。若模型需要大量训练数据,那么收集数据、标注数据、训练模型和验证模型的工作都要针对每个源单独进行。从成本和资源角度来看,当系统数量众多时,这种工作量会变得难以管理。
而迁移学习系统则可以从源系统或模型中提取知识,并以某种方式进行迁移,使其在目标上发挥作用。例如,使用源 A 的训练数据为某个任务训练的模型 A,可以提取知识并迁移到另一个目标任务上。
2. 迁移学习的定义
为了精确定义迁移学习,我们先定义两个概念:领域和任务。
- 领域(Domain) :领域 $D = (X, P(X))$ 由特征空间 $X$ 和边缘概率分布 $P(X)$ 定义,其中 $X$ 表示训练数据样本 $X = {x_1, x_2, …, x_n} \in X$。例如,在二分类的情感分析任务中,$X$ 对应词袋表示,$x_i$ 对应语料库中的第 $i$ 个词项。当两个系统的特征空间或边缘概率分布不同时,我们称领域不匹配。
- 任务(Task) :任务 $T = (Y, f(\cdot))$ 由标签空间 $Y$ 和目标预测函数 $f(\cdot)$ 定义,目标预测函数 $f(\cdot)$ 不是直接观察到的,而是从输入和标签对 $(x_i, y_i)$ 中学习得到的。标签空间由一组实际
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



