主动学习在不同机器学习任务中的应用
在机器学习领域,主动学习是一种强大的技术,它可以帮助我们更高效地利用数据,提高模型的性能。本文将探讨主动学习在语义分割和序列标注这两个常见机器学习任务中的应用。
1. 语义分割中的主动学习
1.1 不确定性采样
在语义分割中,为了提高机器学习模型的准确性,我们可以采取一些策略。例如,对于误差小于 3 像素的情况予以忽略,同时,对于不确定性的测量,可以计算距离边界 3 像素的像素的平均不确定性。
如果使用的模型无法为给定标签提供概率分布,可以采用集成方法和/或丢弃法来生成多个预测,并将不确定性计算为这些预测之间标签一致性的程度。当仅对关心的像素进行采样,并为每个像素获得不确定性分数后,就可以应用任何不确定性采样算法。计算整个图像不确定性的最简单方法是取关心的每个像素的平均不确定性。如果主要关注边界,可以仅对距离其他标签几个像素内的项目进行采样。根据任务需求,也可以尝试使用除平均值之外的其他指标,例如为图像赋予一个不确定性分数,该分数是任何一个区域的最大不确定性。
1.2 多样性采样
与目标识别不同,在语义分割的多样性采样中,不能直接从模型中采样基于模型的异常值。因为目标识别时模型会聚焦于关心的区域,而语义分割算法需要对每个像素进行分类。所以,应该对图像进行掩码或裁剪,使其仅包含关心的预测标签,然后应用基于模型的异常值采样。
对于聚类和代表性采样,同样需要将图像裁剪或掩码到关心的区域,然后应用聚类和/或代表性采样。在考虑现实世界的多样性时,策略与边界框的情况相同,即使用主动学习中已知的所有技术,在关心的人群中进行多样性采样。
以下是多样性采样
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



