视觉显著性计算:原理、方法与评估
人类视觉系统中的视觉显著性
人类视觉系统在处理视觉信息时,存在着与视觉显著性计算紧密相关的特点。
视觉处理机制
- 自下而上机制 :启动较早且速度较快,它基于输入场景的物理特征,如颜色、亮度、对比度等,自动吸引注意力。
- 自上而下机制 :从外侧膝状体(LGN)开始起作用,这是自下而上信息流的早期阶段。随着处理的深入,其影响逐渐增强。该机制利用先验知识来解析和解释输入场景,即使遇到不熟悉的场景也会发挥作用,可视为视觉系统的一种学习机制。一方面,过去的经验有助于高效处理熟悉的场景;另一方面,能从未知场景中挖掘最优处理策略,更新大脑中的知识网络。
视觉显著性计算的相关特性
- 目标 :现有计算注意力/显著性模型主要关注注意力的选择性特征。视觉显著性计算的主要目标是通过突出目标并抑制干扰项,衡量各种视觉子集的重要性。
- 信号类型 :在视网膜中,输入信号可表示为各种前注意特征,通过提取和传输最具信息性的部分进行大幅压缩。压缩后的信号在LGN中进一步处理,形成具有不同空间/时间分辨率的两类信号,分别输入到两条视觉通路进行后续处理。
- 处理单元 :注意力可以分配到空间位置、特征维度和对象上,但我们无法完全控制自己只关注特定单元。因此,对位置、对象和特征维度应用自上而下的调制是合理的。
- 自
超级会员免费看
订阅专栏 解锁全文
23万+

被折叠的 条评论
为什么被折叠?



