利用深度目标检测器进行视频监控
在视频监控领域,基于图像内容的检索比基于文本的检索更具优势,因为文本检索依赖于图像注释,可能存在不完整和主观的问题。而深度检测器提取的特征图具有强大的判别能力,能精确提取场景中所有物体的信息,这对场景识别非常重要。
1. 深度目标检测器的优势
在分类层之前使用特定结构,能让网络学习高效滤波器,与全连接层相比,可减少参数数量,降低推理时间。这对于处理视频监控数据库中的大量数据至关重要。
2. 索引系统
使用目标检测器的一个优点是能提供镜头中物体的类别、置信度分数以及它们的绝对和相对位置。提出的索引系统结合了以下两种方式:
- 语义索引 :深度检测器对镜头中所有帧的预测结果。
- 高维索引 :关键帧的深度检测器获得的特征图,以及关键帧中每个物体(仅考虑边界框内区域)的小型卷积神经网络(tiny CNN)获得的特征图。
保持每个镜头的关键帧特征列表,能简化并显著提高使用深度检测器进行索引的相关性。
3. 小型卷积神经网络(tiny CNN)架构
| 操作 | 详细信息 |
|---|---|
| 输入形状 | (None, None, 3) |
| 批量归一化 | BatchNorm |
超级会员免费看
订阅专栏 解锁全文
908

被折叠的 条评论
为什么被折叠?



