机器学习笔记 - 基于深度学习(HomographyNet)的图像单应性估计

本文介绍了使用深度学习方法——HomographyNet 来估计图像间的单应性。该网络通过4点HOMOGRAPHY参数化进行训练,无需单独的局部特征检测,能直接从图像对中学习单应性。实验表明,这种方法在某些情况下优于传统基于ORB特征的单应性估计,并有潜力应用于实时系统和特定环境的优化。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

 一、图像单应性概述

        论文提出了一个深度卷积神经网络来估计一对图像之间的相对单应性。我们的前馈网络有 10 层,以两个堆叠的灰度图像作为输入,并产生一个 8 自由度的单应性,可用于映射从第一个图像到第二个图像的像素。我们为 HomographyNet 提出了两种卷积神经网络架构:一个直接估计实值单应性参数的回归网络,以及一个在量化单应性上产生分布的分类网络。我们使用 4 点单应性参数化,将一个图像的四个角映射到第二个图像。我们的网络使用扭曲的 MS-COCO 图像以端到端的方式进行训练。我们的方法无需单独的局部特征检测和转换估计阶段即可工作。我们的深度模型与基于 ORB 特征的传统单应性估计器进行了比较,我们强调了 HomographyNet 优于传统技术的场景。我们还描述了由深度单应性估计提供支持的各种应用,从而展示了深度学习方法的灵活性。

        稀疏的 2D 特征点是大多数现代 Structure from Motion 和 SLAM 技术的基础。 这些稀疏的 2D 特征通常称为角点,在所有几何计算机视觉任务中,必须平衡角点检测方法中的误差与几何估计误差。 即使是最简单的几何方法,例如估计两个图像之间的单应性,也依赖于容易出错的角点检测方法。

        从一对图像估计 2D 单应性(或投影变换)是计算机视觉中的一项基本任务。 在以下场景中,单应性是单目 SLAM 系统的重要组成部分:

        仅旋转运动、平面场景、物体离观察者很远的场景。

评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

坐望云起

如果觉得有用,请不吝打赏

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值