多任务学习与多标签设计模式解析
1. 多任务学习的参数共享实现
多任务学习有两种常见的实现方式,即硬参数共享和软参数共享。在这种情况下,模型可以有两个“头”:一个用于预测回归输出,另一个用于预测分类输出。
例如,有研究训练了一个计算机视觉模型,它结合了softmax概率的分类输出和用于预测边界框的回归输出。结果表明,这种通过参数共享的方法,能让任务同时被学习,两个损失函数的梯度更新会影响两个输出,从而得到一个更具泛化能力的模型,比分别训练用于分类和定位任务的网络性能更好。
2. 多标签设计模式概述
多标签设计模式是指可以为给定的训练示例分配多个标签的问题。对于神经网络,这种设计需要更改模型最终输出层使用的激活函数,并选择应用程序解析模型输出的方式。需要注意的是,这与多类分类问题不同,多类分类问题是从多个(> 1)可能的类别中为单个示例精确分配一个标签。
3. 多标签问题的提出
通常,模型预测任务是为给定的训练示例应用单一分类,该预测从N个可能的类别中确定(N > 1)。在这种情况下,通常使用softmax作为输出层的激活函数。使用softmax时,模型的输出是一个N元素数组,所有值的总和为1,每个值表示特定训练示例与该索引处的类别相关联的概率。
例如,当模型对图像进行分类,判断是猫、狗还是兔子时,对于某张图像,softmax输出可能是 [.89, .02, .09],这意味着模型预测该图像有89%的概率是猫,2%的概率是狗,9%的概率是兔子。由于在这种情况下每个图像只能有一个可能的标签,我们可以通过取argmax(概率最高的索引)来确定模型预测的类别。
而不太常
超级会员免费看
订阅专栏 解锁全文
15万+

被折叠的 条评论
为什么被折叠?



