视觉显著性应用:从模型训练到实际场景的探索
1. 训练视觉显著性模型时消除标签歧义
在训练视觉显著性模型时,大多数用户数据往往不准确或不充分,难以直接用于模型训练。为解决这一问题,提出了两种方法来应对标签歧义。
- 处理视频注视点歧义 :将稀疏的正样本和未标记数据嵌入到成本敏感的排序学习框架中,有效解决视频注视点的歧义问题。
- 处理图像注视点或标记矩形歧义 :提出多实例排序学习框架,通过迭代恢复正确的实例标签并训练显著性模型。该学习算法能够聚焦于真实目标和真实干扰项之间的相关性。
大量实验和对比表明,这两种方法在整体性能上取得了显著提升。生成的显著性图通常“噪声”更少,因为成功去除了伪目标;同时,由于去除了伪干扰项,整个显著对象能够更加突出。这些显著性图有望促进基于图像的应用,如目标分割或基于内容的图像检索。
2. 显著性应用概述
随着互联网的快速发展,图像和视频的数量呈爆炸式增长。为满足用户的各种需求,开发智能的计算机视觉和多媒体应用显得尤为重要。视觉显著性在这些智能应用中起着关键作用,主要体现在以下两个方面:
- 与重要内容紧密相关 :显著性子集对应着图像或视频的重要内容,关注这些子集可以使处理结果与图像和视频的主要内容紧密相关。
- 反映用户兴趣 :有趣的目标通常具有视觉显著性,因此视觉显著性在一定程度上可以反映用户的兴趣。强调显著内容可以使应用根据用户的兴趣提供针对性的服务。
接下来将介绍几类基
超级会员免费看
订阅专栏 解锁全文
6万+

被折叠的 条评论
为什么被折叠?



