实时图像处理中显著颜色的无监督识别
1. 引言
人类具备从对物理环境的观察中创建简单抽象概念的潜意识能力。在处理和交流本地环境中重要特征的信息时,以“红色”或“蓝色”等概念来考虑物体颜色,而非反射光波长的空间分布,这种能力至关重要。在图像处理中实时识别这些特征,需要通过软件实现将图像分割成显著颜色区域的过程,从而将存储和处理的信息从三维像素值简化为简单的颜色类别标签。
图像分割通常是为每个像素分配一个特征向量(包含空间和/或颜色信息),对于实时应用,常将特征向量维度降低至仅包含颜色信息,为每个像素分配对应高级颜色概念的类别标签,如“红色”或“黄色”。这样做有两个主要优点:一是通过在低维搜索空间中处理,降低计算复杂度;二是消除空间类别依赖,使像素 - 标签映射可以离线计算并存储在静态数据结构中,实现常量时间访问。
这里聚焦于颜色分割任务,选择RoboCup机器人足球场景进行实验,因为该场景中场地线、球门和球等显著特征都有独特的颜色编码,且实时处理性能对机器人响应能力至关重要。为Robotis DARwIn - OP人形机器人开发了一种无需人工监督的像素 - 标签映射生成和存储系统,并根据特征分类性能评估映射质量,最后将该方法与人类专家手动生成的映射在性能和生成时间上进行了定量比较。
2. 颜色视觉方法
2.1 颜色空间
过往研究表明,在无监督颜色分割方面,Y CbCr颜色空间(与RGB、HSV和CIE L a b相比)在内部和外部验证技术上都表现最优。而且,许多相机(包括安装在DARwIn - OP机器人平台上的Logitech C905相机)的原生颜色空间就是Y CbCr,因此在整个研究中,
超级会员免费看
订阅专栏 解锁全文
2104

被折叠的 条评论
为什么被折叠?



