【论文笔记】视觉重定位 场景坐标回归 Efficient multi-output scene coordinate prediction 2020

提出一种混合方法,利用改进的CNN提取图像特征,结合回归森林预测3D坐标,实现快速准确的单目RGB图像相机重定位。通过SURF特征点选取patch,减少RANSAC工作量,提高运行速度。

Efficient multi-output scene coordinate prediction for fast and accurate camera relocalization from a single RGB image

巴黎中央理工

这是一篇混合方法,使用重新设计的CNN网络提取patches的特征,

然后输入到回归森林对patches的中心点像素坐标进行预测,得到多个3D坐标,选择置信度最高的一个作为预测,由此得到2D-3D对应关系。

最后根据Pnp和RANSAC求解相机位姿

在这里插入图片描述

论文方法

1.patch选择和对应标签制作

使用patch可以过滤掉与场景无关的位置(天空、墙壁等),去除噪声可以减少RANSAC的工作量进而加快运行速度。

本文只取以SURF特征点为中心的49X49的区域作为patch输入。

对应中心点的3D坐标标签计算:(使用RGBD信息,D为深度,p为图像二维坐标,k为相机内参)
相机坐标系下坐标:Pic=DiK−1[pi1] 相机坐标系下坐标:P_{i}^{c}=D_{i} K^{-1}\left[\begin{array}{c}p_{i} \\1\end{array}\right] Pic=DiK1[pi1]

使用已知相机位姿转换到世界坐标系:[Piw1]=[Rt01][Pic1] 使用已知相机位姿转换到世界坐标系:\left[\begin{array}{c}P_{i}^{w} \\1\end{array}\right]=\left[\begin{array}{c|c}R & t \\0 & 1\end{array}\right]\left[\begin{array}{c}P_{i}^{c} \\1\end{array}\right] 使姿[Piw1]=[R0t1]

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值