智能摄像头网络中的多视角目标识别与摄像头选择切换技术
1. 多视角目标识别
1.1 多视角利用方式
当有多个视角可用时,有多种方法可用于提高识别效果。最简单的方法是通过多数投票来确保各个视角之间的一致性,也可以直接在联合表示域中进行分类学习。不过,大多数现有方法都假定相机的相对位置是已知且固定的。
1.2 实验设置
为了验证算法在真实多视角图像上的性能,使用了公共的 COIL - 100 数据集。该数据集包含 100 个物体在 0 到 360 度之间以 5 度增量拍摄的 72 个视角的图像。具体操作步骤如下:
1. 对每个图像使用 10 - D PCA - SURF 描述符计算局部特征表示。这些描述符是在规则网格上以 4 像素间距提取的,并结合其图像位置形成 12 - D 特征空间。
2. 利用 COIL - 100 图像子集的特征,使用 LIBPMK 中的分层 k - means 计算多分辨率直方图图像表示的词汇表。设置 4 个级别和分支因子为 10,在层次的最精细级别得到 991 个词的词汇表。
3. 用层次直方图的最精细级别表示每个图像,并进行 ℓ1 恢复。通过直方图交集计算每个图像对应的 991 - D 直方图向量之间的相似度。
4. 对于每个物体,从完整的 360 度视角圆中均匀采样 10 个训练示例。为了对查询图像进行分类,使用数据集中其相邻视角的投影特征联合恢复特征,但分类是基于每个视角进行的,以便公平比较分布式压缩算法的质量。
1.3 不同压缩方法性能
不同压缩方法在该数据集上的性能表现如下:
|压缩方法|性能表现|
| ---- |
多视角目标识别与摄像头切换技术
超级会员免费看
订阅专栏 解锁全文
34

被折叠的 条评论
为什么被折叠?



