智能相机网络中的多视图目标识别系统
1. 引言
目标识别在计算机视觉领域一直是研究热点。传统的目标识别系统,通常是从一组目标类别中捕获目标的多个实例,然后对可能包含一个或多个已知目标类别的新测试图像进行分类。过去已经有许多成功的方法,如行人检测、通用目标检测(如车辆和动物)以及场景标注(如建筑物、高速公路和社交活动)。这些方法大多基于对局部图像块的分析,这些局部图像块对图像缩放、仿射变换和视觉遮挡具有鲁棒性或不变性。
近年来,出现了一种新的场景:使用智能相机网络同时从多个视角获取图像。传统方法通常假设相机与中央计算机可靠连接且带宽无限制,多视图图像(或其SIFT表示)会被集中传输到计算机进行识别。而分布式目标识别的研究主要集中在两个方向:
- 特征对应建立 :当多个图像共享一组共同的视觉特征时,可以在不同相机视图之间建立对应关系。例如,SIFT框架最初的动机就是建立这种对应关系。后来,有研究提出利用特定特征的先验空间分布来指导多视图匹配过程,提高识别效果。还有研究通过随机投影,在速率受限的相机通信中,在低维空间中估计可靠的特征对应关系。
- 分布式数据压缩 :当相机传感器带宽不足时,可利用分布式数据压缩对特征进行编码和传输。已经有多种方法用于直接压缩二维视觉特征,如PCA、熵编码和语义哈希等。对于SIFT类型的视觉直方图,也有提出高效的编解码器来压缩直方图的层次结构。另外,有研究提出多视图SIFT特征选择算法,通过考虑多个相机视图中特征直方图的联合分布来减少需要传输的SIFT特征数量,但该方法需要学习不同相机视图之间的互信息,且相机相对位置必须固定。
超级会员免费看
订阅专栏 解锁全文
893

被折叠的 条评论
为什么被折叠?



