主动领域不变自我定位与行人视频异常检测技术解析
1. 主动领域不变自我定位技术
在主动视觉定位与识别(VPR)领域,深度Q网络(DQN)被用于解决高维状态/动作空间中标准表格式价值函数的问题。DQN的基本概念是使用深度神经网络(而非表格)来近似价值函数。
- DQN的具体设置
- 状态向量 :使用RRF向量作为DQN的状态向量。
- 动作集 :由30个离散动作集组成,分别是沿着训练视点轨迹向前移动1m、2m,直至30m。
- 训练回合数 :设置为300,000。
- 训练稳定技术 :采用经验回放技术来稳定DQN的训练过程,其实现遵循原始的相关工作。
- 奖励机制 :奖励基于训练回合中多视图VPR的预测是否与正确答案匹配来确定。具体步骤如下:
1. 使用贝叶斯滤波器将训练回合中的一系列里程计和图像数据整合为视点特定的概率分布向量(PDV)估计。
2. 将视点特定的PDV映射到地点特定的PDV。
3. 将地点特定的PDV转换为排名第一的地点类别ID。
4. 如果这个排名第一的预测结果与真实的地点类别匹配,则分配+1的正奖励;否则,分配 -1的负奖励。
2. 实验设置
- 数据集 :使用公共的NCLT数据集,该数据集包含在密歇根大学北校区不同时间和季节操作Segway机器人获得的经验数据。主要使用车载传感器Lad
超级会员免费看
订阅专栏 解锁全文
1266

被折叠的 条评论
为什么被折叠?



