多实例学习排序方法在视觉显著性计算中的应用
在视觉显著性计算领域,数据标签的模糊性是一个常见且棘手的问题。传统的学习算法在处理这类弱标签数据时往往效果不佳。为了有效应对不同类型标签模糊性的弱标签数据,多实例学习排序方法应运而生。
1. 方法背景与概述
在视觉显著性计算中,样本对的显著性差异能为排序函数选择有区分性的特征提供有效线索。然而,目标之间或干扰物之间的相关性(即显著性差异较小的样本对)可能会使特征选择过程偏向错误的视觉属性,从而降低AUC分数。这意味着以成本敏感的方式惩罚目标之间和干扰物之间的相关性,有助于视觉显著性计算。
简单的学习排序框架通过同时考虑局部视觉属性和成对上下文的影响,能取得不错的性能。并且,将正样本和未标记数据以成本敏感的方式直接整合到优化目标中,所学习到的显著性模型可以通过关注可靠目标和干扰物之间的相关性,超越其他基于学习的方法。不过,该方法仅考虑了使用稀疏正样本进行训练的情况。
多实例学习(MIL)方法旨在从具有标签模糊性的数据(即弱标签数据)中学习模型,其中训练实例来自正包和负包。在传统的多实例学习约束下,每个正包至少包含一个或稀疏的正实例,而每个负包中的所有实例都被假定为负实例。受此启发,在训练视觉显著性模型时,每个图像块的实际标签也被视为未知。相反,每个正包中真实目标的最小数量和每个负包中真实干扰物的最小数量被作为约束条件纳入考虑。
2. 问题表述
视觉显著性可被视为图像中各种对象相对重要性的指标。但同一对象在不同图像中的绝对显著性值可能差异显著,因此可能不存在从局部视觉属性到视觉显著性值的直接“特征 - 显著性”映射函数。我们假设视觉显著性应由内在视觉属性和空间/时空视觉上下文共
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



