2、VICAL:用于概念学习以理解语义图像内容的视觉认知架构

VICAL:用于概念学习以理解语义图像内容的视觉认知架构

1. 引言

视觉学习在目标识别研究中是一个颇具吸引力的趋势,因为它似乎是构建能够理解广泛图像类别的视觉系统的唯一途径。然而,视觉学习是一项复杂的任务,通常需要问题分解、大量的数据处理,并且最终会耗费大量时间。在大多数文献报道的视觉学习方法中,学习仅限于参数优化,通常涉及特定的处理步骤,如图像分割、特征提取等。只有少数研究尝试在最高(即识别)级别闭合学习过程的反馈。

为了在语义层面提供图像分析,研究工作聚焦于自动提取与人类感知相匹配的图像描述。这些努力的最终目标是弥合可以从视觉内容中自动提取的低级视觉特征与捕捉所传达意义的高级概念之间的所谓语义鸿沟。在后续的认知架构中,我们强调多个描述层次基于这样一个广泛持有的信念:计算视觉不能从信号域信息一步到位地实现空间和语义理解。

2. 视觉认知框架 VICAL

我们提出了一种视觉机器学习方法,它实现了视觉模态的认知行为和目标识别的视觉学习。下面,我们将指出图像预处理(特征检测)和后处理(基于内容的图像理解)所需的所有基本特征,包括结构和行为方面。

2.1 眼睛处理器

眼睛处理器仿照人类感官器官设计输入感官通道,它能够过滤视觉问题,并感知针对给定问题必须实际执行的操作。在精心设计的视觉架构中,眼睛处理器代表将问题空间周围的环境与目标认知行为连接起来的接口。

其主要功能限于使用一些指低级图像处理的基本运算符来分析、处理和解释视觉信息。因此,如果图像中存在视觉信息,眼睛处理器会封装多个基本处理器(盲检测器处理器)以并行方式执行分割过程。这种策略能够在没有任何先验知识的情况下进行有效探索,并减少分割时间。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值