视觉显著性模型训练中消除标签歧义的实验研究
1. 实验数据集
为评估所提出方法的性能,使用了两个公开图像数据集进行实验。
- MSRA 数据集 :这是一个区域显著性数据集,包含 5000 张具有明显显著对象和“干净”背景区域的图像。对于每张图像,有多个高度一致的矩形覆盖整个显著对象。此外,从该数据集中选取了 1000 张图像,为每个显著对象手动生成了精确轮廓。在实验中,使用这 1000 张带有精确对象掩码的图像进行训练和测试,随机选择 900 张带有标记矩形的图像作为训练子集,其余 100 张作为测试子集。不同主体提供的矩形高度一致,主体间的 ROC 可达 0.97。在训练子集中,只要图像块被任何主体标记为正样本,就将其视为正训练样本。
- MIT 数据集 :这是一个由 Judd 等人提供的眼动注视数据集,包含 1003 张内容丰富的图像。对于每张图像,使用眼动追踪设备生成注视密度图来描绘显著对象的分布。选取 903 张图像构建训练子集,其余 100 张作为测试子集。在训练子集中,只要任何主体的眼动注视落在图像块上,就将其视为正训练样本。
2. 实验设置
在这两个数据集上进行了三个实验。
2.1 与基线方法比较
将所提出的方法与几个基线方法在 MSRA 数据集上进行比较,主要目的是展示所提出方法各组件的有效性,如在多实例学习框架中使用代表性样本和训练排序模型。基线方法包括:
- SVM - AP :使用通过亲和传播生成的代表性样本训练典型的 SVM 分类模型。
-
超级会员免费看
订阅专栏 解锁全文
1426

被折叠的 条评论
为什么被折叠?



