多实例学习排序方法在视觉显著性计算中的应用
在视觉显著性计算领域,数据标签的模糊性是一个常见且棘手的问题。传统的学习算法在处理这类带有不同类型标签模糊性的弱标签数据时,往往效果不佳。为了解决这一问题,多实例学习排序方法应运而生。
1. 背景与动机
在视觉显著性计算中,样本对的显著性差异能为排序函数选择有区分性的特征提供有效线索。然而,目标之间或干扰物之间的相关性(即显著性差异较小的样本对)可能会使特征选择过程偏向错误的视觉属性,从而降低AUC分数。这表明,以成本敏感的方式惩罚目标之间和干扰物之间的相关性,有助于视觉显著性计算。
简单的学习排序框架通过同时考虑局部视觉属性和成对上下文的影响,能取得令人印象深刻的性能。通过将正样本和未标记数据以成本敏感的方式直接整合到优化目标中,学习到的显著性模型可以通过关注可靠目标和干扰物之间的相关性,优于其他基于学习的方法。但该方法的一个缺点是,它只考虑了使用稀疏正样本进行训练的情况。
2. 多实例学习排序方法概述
多实例学习排序方法旨在有效处理带有不同类型标签模糊性的弱标签数据。与传统学习算法不同的是,该方法也考虑了标签的模糊性。
一般来说,多实例学习(MIL)方法旨在从具有标签模糊性的数据(即弱标签数据)中学习模型,其中训练实例来自正包和负包。在传统的多实例学习约束中,每个正包被假设至少包含一个(如Andrews等人,2003)或稀疏的(如Bunescu和Mooney,2007)正实例,而每个负包中的所有实例都被假设为负实例。
受此启发,在训练视觉显著性模型时,每个图像块的实际标签也被认为是未知的。相反,每个正包中真实目标的最小数量和每个负包中真实干扰物的最小
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



