计算机视觉系统:从感知到决策的全面解析
1. 目标识别与特征提取
在图像中识别目标时,可从训练图像中提取目标的关键点,为目标提供“特征描述”。Lowe 的图像特征生成方法能将图像转换为大量特征向量集合,这些向量对图像平移、缩放和旋转具有不变性,对光照变化部分不变,且对局部几何畸变具有鲁棒性。
对于基于内容的图像检索,通过识别输入图像与数据库中图像关键点的最近邻来进行匹配。但对于现代大型数据库,这些方法扩展性不佳,无法在可接受时间内从数据库中选出少量匹配图像。为加速搜索,Lowe 使用了 K - d 树算法的改进版 Best - bin - first(BBF)搜索方法,虽能以有限计算量大概率识别最近邻,但在高维空间中,因“维数灾难”问题,搜索效率可能退化为顺序搜索。
2. 位置识别
位置识别旨在对世界中的离散地点进行命名。需将环境离散划分为不同地点并表示,存储在数据库中。识别时,先根据机器人当前传感器测量值计算表示,再在数据库中搜索最相似表示,进而确定机器人位置。
视觉传感器(如相机)适合创建丰富、具描述性和区分性的表示。视觉表示主要分为全局表示和局部表示:
- 全局表示 :将整个相机图像作为地点表示,可作为局部区域的紧凑表示,但无法识别特定空间结构。
- 局部表示 :先识别图像显著区域,再创建表示,依赖兴趣点或兴趣区域检测器。随着有效兴趣点检测器的发展,局部方法实用且应用广泛,是位置识别的首选方式。
2.1 从特征袋到视觉词
仅用一组兴趣点表示图像称为特征袋。为每个兴趣点计算旋转、缩放、强度和视角
超级会员免费看
订阅专栏 解锁全文
14万+

被折叠的 条评论
为什么被折叠?



