视觉显著性模型训练中消除标签歧义的实验研究
1. 实验数据集
在视觉显著性模型的研究中,为了评估所提出方法的性能,选用了两个公开图像数据集进行实验。
- MSRA 数据集 :这是一个区域显著性数据集,包含 5000 张具有明显显著对象和“干净”背景区域的图像。对于每张图像,有多个高度一致的矩形框覆盖整个显著对象。此外,从该数据集中选取了 1000 张图像,为每个显著对象手动生成了精确的轮廓。在实验中,使用这 1000 张带有精确对象掩码的图像进行训练和测试,随机选取 900 张带有标签矩形框的图像作为训练子集,其余 100 张作为测试子集。不同受试者提供的矩形框高度一致,受试者间的 ROC 可达 0.97。在训练子集中,只要有任何受试者将一个图像块标记为正样本,它就会被视为正训练样本。
- MIT 数据集 :这是一个由 Judd 等人提供的眼动注视数据集,包含 1003 张内容丰富的图像。对于每张图像,使用眼动追踪设备生成注视密度图来描绘显著对象的分布。选取 903 张图像构建训练子集,其余 100 张作为测试子集。在训练子集中,只要有任何受试者的眼动注视落在一个图像块上,它就会被视为正训练样本。
2. 实验设置
2.1 对比基线
在第一个实验中,将所提出的方法与几个基线方法在 MSRA 数据集上进行比较,主要目的是展示所提方法各个组件的有效性,如在多实例学习框架中使用代表性样本和训练排序模型。这些基线方法包括:
- SVM - AP :使用通过亲和传播生成的代表性样本训练典型的 SVM 分类模型。
超级会员免费看
订阅专栏 解锁全文
1436

被折叠的 条评论
为什么被折叠?



