【深度学习基础知识 - 12】深度估计概述

深度估计是计算机视觉的关键任务,旨在获取物体与拍摄点的间距,生成深度图。本文介绍了视差(光流)、深度信息获取方法,并探讨深度学习在提高精度和降低成本上的优势。深度信息广泛应用于三维重建、自动驾驶、活体检测等领域。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

深度估计是计算机视觉领域中的一个子任务,其目的是获取物体和拍摄点之间的距离,为三维重建、距离感知、SLAM、视觉里程计、活体检测、视频插帧、图像重建等一系列任务提供深度信息。这篇文章会对其做一个简单介绍。

任务目标

  • 深度估计任务的目标就是获取物体和拍摄点之间的距离,最终会获得一个深度图,也称为光流图,它记录了同一物体在不同图像之间的视差,再通过相机参数、两个拍摄点之间的位置信息即可换算出物体和拍摄点之间的距离。

什么是视差(光流)

  • 先举一个直观的例子,大家应该都坐过车,在车辆移动时往窗外看去,可以看到远处的物体变化的慢,而近处的物体变化的非常快,这里面蕴含的就是视差信息。
  • 视差也被称为光流,在上面的例子中,随着车辆的移动,假设你在两个连续的时刻各拍了一张图,如果这两张图像中有一些相同的物体,那么这些物体在这两张图像中像素坐标的差异通常是不同的,而如果某个物体在这两张图片中的像素坐标差异非常大,那么由此可判断这个物体离拍摄点相对较近,而如果某个物体在这两张图像中的像素坐标差异较小,那么可以推断出这个物体距离拍摄点相对较近,也就是说,较近的物体视差较大,较远的物体视差较小,而同一物体在不同图像中的像素坐标差异,就是视差。

深度估计的应用场景

  • 视差的主要作用是获取物体的深度信息,也就是和拍摄点之间的距离。
  • 在三维重建任务中,可以由此深度获取物体的三维点云图,然后进行三维重建。
  • 在距离感知任务中,如基于视觉的自动驾驶中,可以由此判断场
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

雁宇up

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值