基于知识的视觉显著性计算方法解析
一、基于知识的显著性模型概述
在视觉显著性计算中,有一种基于知识的显著性模型。该模型先对显著性图进行处理,用半径为 3 的圆盘滤波器对显著性图进行卷积,以填充平滑区域中相邻块因应用不一致的前景先验而产生的“空洞”。之后进行指数运算 (S^{*} {r}(n)=S {r}(n)^3),去除因使用加法贝叶斯公式而产生的模糊背景。
从这些处理过程可以看出,该方法具有生物学合理性。神经生物学证据表明,人类视觉系统中的自下而上因素比自上而下因素作用更快。视觉信号首先会公平竞争以生成自下而上的显著性,随后较慢的回忆或识别过程会将相关先验知识加载到工作记忆中,从而影响竞争。在这个过程中,自下而上的显著性图会受到各种自上而下的先验信息调制,突出真正的目标并抑制真正的干扰项。
此方法还具有良好的泛化能力且易于扩展。一方面,可以将任何先进的自下而上显著性模型嵌入到该框架中;另一方面,如果能学习更多种类的先验知识(如任务相关先验),可以通过计算更多种类的自上而下显著性图将其轻松融入框架,从而更准确地估计视觉显著性。
二、实验设置
为证明该方法的有效性,进行了一系列实验,主要目标有两个:一是评估先验知识在估计视觉显著性时是否有用;二是探索先验知识在估计过程中如何起作用。为此,采用了两个数据集:
- Toronto - 120 :由 Bruce 和 Tsotsos 在 2005 年提出,包含 120 张彩色图像。在自由观看条件下记录了 20 个不同受试者在每张图像上的注视点,以揭示显著目标的位置。
- MIT - 1003
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



