智能相机网络中的多视角目标识别与相机选择切换技术
1 多视角目标识别
1.1 多视角利用方式
当有多个视角可用时,有多种方法可用于提高识别效果。最简单的方法是通过多数投票来确保各视角之间的一致性,也可以直接在联合表示域中进行分类学习。不过,大多数现有方法都假设相机的相对位置是已知且固定的。
1.2 实验设置
为了验证算法在真实多视角图像上的性能,使用了公共的 COIL - 100 数据集。该数据集包含 100 个物体从 0 到 360 度以 5 度增量拍摄的 72 个视角的图像。具体操作步骤如下:
1. 对每个图像计算局部特征表示:使用在规则网格上提取的 10 - D PCA - SURF 描述符(网格间距为 4 像素),并将其与图像位置结合形成 12 - D 特征空间。
2. 计算词汇表:使用分层 k - means 和 LIBPMK 对 COIL - 100 图像的一个子集的特征进行处理,得到多分辨率直方图图像表示的词汇表。设置 4 个级别和分支因子为 10,在层次结构的最精细级别得到 991 个词的词汇表。
3. 图像表示与恢复:使用层次直方图的最精细级别表示每个图像,并进行 ℓ1 恢复。通过直方图交集计算每个图像对应的 991 - D 直方图向量之间的相似度。
4. 训练与分类:对每个物体,从完整的 360 度视角圈中均匀采样 10 个训练示例。为了对查询图像进行分类,使用数据集中其相邻视角的投影特征联合恢复特征,但分类是基于每个视角进行的,以便公平比较分布式压缩算法的质量。
1.3 实验结果
不同压缩方法在该数据集上的性能如图 5 所示。顶部的实线表示假设过程
超级会员免费看
订阅专栏 解锁全文
1201

被折叠的 条评论
为什么被折叠?



