物体识别中的几何与语义问题探讨
1. 特征与几何信息在物体识别中的作用
在物体识别领域,特征提取和几何信息的利用至关重要。分类器在一定程度上能够响应轮廓信息,例如HOG特征就对轮廓有响应。然而,目前仍缺乏更好的方法来突出轮廓信息并抑制纹理信息。一种可能的改进方向是将更先进的分割器与轮廓测量方法(如Pb)相结合。
对于阴影特征,其在物体识别中的作用还不太明确。尽管有理由认为某些物体的阴影模式具有独特性,但当前的特征构建方法在早期阶段就通过计算方向来抑制阴影信息。阴影信息可能仅在较大的图像尺度上以及相对于特定的物体区域才有作用,然而确定物体的支持区域是一项极具挑战性的任务。
几何信息在物体识别中可以提供上下文信息,从而帮助提高识别效果。例如,位于同一地面平面上的一组物体的图像外观特征是相关的,因为它们共享相同的地面平面和相机视角。此外,从房间的图片中恢复房间的大致形状也是几何信息应用的一个例子。Hedau等人(2009)提出的方法将房间建模为一个盒子,利用消失点估计盒子的旋转,再结合学习到的特征估计其平移和长宽比。这种方法不仅可以估计房间的外观,还能用于估计自由空间、提高家具检测的准确性以及评估房间表面的可用性。
2. 几何问题:形状表示的挑战
几何在物体识别中的另一个重要作用是形状表示,但目前面临两个主要困难。首先,二维形状的表示方法与物体识别方法的结合效果并不理想。其次,物体的二维形状会随着观察方向的变化而改变,即所谓的视角效应。
在文献中,主要有两种表示图像形状的方法:
- 分解为原始子形状 :将形状分解为各种原始子形状,通常用它们的骨架来表示,然后处理这些原始子形状
超级会员免费看
订阅专栏 解锁全文
3万+

被折叠的 条评论
为什么被折叠?



