视觉场景处理与应用的多领域探索
1. 视觉场景解读
视觉场景解读在计算机视觉领域占据着关键地位,其中范围图像分割和视觉不变性是重要的研究方向。
范围图像分割方面,相较于已发表的众多分割算法,范围图像分割算法相对较少。当能假设分割场景的一些先验信息,如场景对象表面的平面性时,范围分割会显著简化。然而,实际测量的范围场景大多包含一般对象,无法使用平面假设,这使得范围分割任务变得更加困难。例如,可利用多模态(范围和强度数据)范围分割器进行一般对象分割,该方法还可推广到动态范围数据。
视觉不变性对于理解真实场景至关重要。由于自然材料的视觉外观会因采集环境(如光照条件和视点位置)的不同而有很大变化,这给场景理解带来了巨大挑战。图像采集条件的不变性是计算机视觉应用的重要方面。若缺乏足够的不变性类别,应用程序需要在各种光照和观看条件下捕获多个训练图像。而从所有可能的外观组合中学习不仅笨拙、昂贵,而且在某些情况下根本无法实现。同时,过度的不变性通常会降低特征的可区分性,影响识别效果。
- 光照不变性 :对于几种视觉纹理模型,可以推导出在光照方向和局部强度变化下仍能保持鲁棒性的高效光照不变量。这些不变量可从马尔可夫模型统计中高效计算得出,与标准参数估计相比,开销较小。通过仅使用每个材料纹理的一个训练图像,无需了解光照方向或光谱,就可以学习分类器。例如,在Outex数据库的纹理光照不变识别中,对马尔可夫光照不变量和局部二值模式(LBP)特征进行了性能比较。此外,马尔可夫光照不变量还应用于移动瓷砖检索咨询系统。用户使用运行该安卓应用的手机拍摄瓷砖照片,图像通过GSM数据连接传输到服务器,服务器从大型商业瓷砖数据库中返回最相似的瓷砖,可
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



