半监督学习(Semi-Supervised Learning)
Semi-Supervised Learning.
半监督学习(Semi-Supervised Learning)是指同时从有标签数据和无标签数据中进行学习,适用于标注数据有限、标注成本较高的场合。值得一提的是,目前半监督学习方法主要是为视觉任务设计的,而在自然语言任务中通常采用预训练+微调的学习流程。
在半监督学习中,通过有标签数据构造监督损失$$\mathcal{L}_s$$,通过无标签数据构造无监督损失$$\mathcal{L}_u$$,总损失函数通过权重项$\mu$加权:
$$ \mathcal{L} = \mathcal{L}_s + \mu \mathcal{L}_u $$
其中权重项$\mu=\mu(t)$通常设置为随训练轮数$t$变化的斜坡函数(ramp function),以逐渐增大无监督损失的重要性。
半监督学习的一些假设:
- 平滑性假设 (Smoothness Assumption):如果两个数据样本在特征空间的高密度区域中接近,则他们的标签应该相同或非常相似。
- 聚类假设 (Cluster Assumption)