计算机视觉：立体视觉简介与实现

最新推荐文章于 2025-11-30 21:26:51 发布

PzBlockchain

最新推荐文章于 2025-11-30 21:26:51 发布

阅读量226

点赞数

CC 4.0 BY-SA版权

文章标签：计算机视觉 opencv 人工智能机器学习-深度学习

本文链接：https://blog.youkuaiyun.com/PzBlockchain/article/details/133184419

机器学习-深度学习专栏收录该内容

93 篇文章 ¥59.90 ¥99.00

订阅专栏

本文简要介绍了立体视觉的基本原理，包括视差计算、立体匹配和三维重建。通过比较双摄像头图像中的像素差异，推断物体深度信息，并提供基于区域的视差计算、立体匹配和三维重建的示例代码。

引言：
计算机视觉是人工智能领域中的重要分支，致力于使计算机能够理解和解释图像或视频数据。立体视觉是计算机视觉领域中的一个重要研究方向，它通过模仿人类双眼观察世界的方式来实现深度感知和三维重建。本文将简要介绍立体视觉的基本原理，并提供一些示例代码来帮助读者了解其实现方法。

立体视觉基础
立体视觉的基本原理是利用两个视野稍微有所不同的摄像机（或称为“眼睛”）来捕获场景的图像，然后通过比较这两个图像中的像素差异来推断不同物体之间的距离和深度信息。在立体视觉中，常用的技术包括视差计算、立体匹配和三维重建。
视差计算
视差是指同一物体在两个视野中的像素位置差异。通过计算视差，可以得到不同物体之间的距离信息。一种常用的视差计算方法是基于区域的视差计算，它将图像分成小的区域，并对每个区域进行匹配。以下是一个简单的示例代码，用于计算视差图：

import cv2

def compute_disparity(image_left, image_right):

了解本专栏

订阅专栏解锁全文

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

PzBlockchain

关注关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

订阅专栏

计算机视觉基础知识（七）--立体视觉

newsymme的博客

01-17

777

1.立体视觉 立体视觉定义一种计算机视觉技术；目的是从两幅或以上的图像中推理出图像中每个像素点的深度信息； 立体视觉应用领域机器人；辅助驾驶/无人驾驶无人机 立体视觉的原理借鉴了人类双眼的“视差”原理；左、右眼对于物体的观测存在差异；大脑利用左、右眼的差异，使得人类能够辨识物体的远近。单目系统 O为相机的光心；是摄像头的成像平面； P和Q为空间中的两个点；缺点：对重合的两个点P和Q无法提供深度信息 2.双目系统&视差双目系统极平面：三

双目立体匹配：从视差图到深度图

IlgCrystal的博客

09-20

1569

双目立体匹配是计算机视觉中的一项重要技术，它通过分析左右两个图像之间的视差信息，可以推断出场景中物体的深度信息，并生成深度图。计算机视觉中的双目立体匹配是一项重要的技术，通过分析左右两个图像之间的视差信息，可以推断出场景中物体的深度信息，进而生成深度图。视差计算：根据匹配代价，对于左图像中的每个特征点，选择右图像中与之匹配代价最小的点，计算其视差值。特征提取可以帮助寻找图像中具有显著性的点，用于后续的匹配。视差计算：根据匹配代价，对于每个左图像中的特征点，选择右图像中与之匹配代价最小的点，计算其视差值。

参与评论您还未登录，请先登录后发表或查看评论

【亲测免费】高精度立体视觉：Stereo Transformer 的探索与应用

gitblog_00012的博客

04-15

588

高精度立体视觉：Stereo Transformer 的探索与应用在计算机视觉领域，立体视觉是一个关键的技术，它通过分析图像对以获取场景的深度信息。是一个开源项目，利用先进的深度学习算法，为立体匹配任务提供了一种高效且准确的新方法。项目简介 Stereo Transformer 是由机器学习专家开发的一个框架，旨在解决传统的立体匹配问题。该模型采用Transformer架构，结合卷积神经网络...

机器视觉——双目视觉的基础知识（视差深度、标定、立体匹配）

热门推荐

m0_61238051的博客

10-13

1万+

一、背景 ”张正友标定”是指张正友教授1998年提出的单平面棋盘格的摄像机标定方法[1]。文中提出的方法介于传统标定法和自标定法之间，但克服了传统标定法需要的高精度标定物的缺点，而仅需使用一个打印出来的棋盘格就可以。同时也相对于自标定而言，提高了精度，便于操作。因此张氏标定法被广泛应用于计算机视觉方面。二、计算内参和外参的初值 1、计算单应性矩阵H 根据之前博客介绍的摄像机模型，设三维世界坐标的点为X=[X,Y,Z,1]T ，二维相机平面像素坐标为m=[u,v,1]T ，所以标定用的棋盘格平面到图像

立体视觉几何 (二)

dc爱傲雪和技术

01-22

2456

SSD和SAD都是衡量图像间相似度的有效方法，但它们各有优势和局限性。SSD更适用于低噪声图像，能够强调大的像素差异，但在噪声较多的情况下可能不理想。SAD在处理噪声图像时表现更好，但可能对某些重要的像素变化不够敏感。选择哪种匹配函数取决于具体的应用场景和图像特性，以及处理速度的要求。在某些硬件架构上，SAD的计算可能比SSD更快。您提到了相关性（Correlation）和归一化相关性（Normalized Correlation）这两种用于立体匹配的方法。

学生竞赛的计算机视觉：立体视觉：立体视觉（第 11 章）：学生竞赛团队的计算机视觉训练-matlab开发

05-29

在计算机视觉领域，立体视觉是实现三维空间理解的关键技术之一，尤其在学生竞赛中，它可以帮助团队构建先进的项目。本教程主要围绕“立体视觉”展开，重点在于利用MATLAB进行图像处理和分析。MATLAB是一种强大的编程...

从零开始学计算机视觉：基础代码实现记录

08-21

资源内容涵盖了计算机视觉的核心概念，如图像的获取与处理、特征提取、目标检测、图像分割、立体视觉、深度学习在计算机视觉中的应用等。每一个概念都配有相应的代码实现，使得理论与实践相结合，为读者构建了一个...

鲁棒计算机视觉：理论与应用

11-17

本书系统阐述了鲁棒计算机视觉的核心理论与实践方法，聚焦于最大似然框架在视觉相似性、颜色、纹理、形状、立体匹配、运动跟踪及面部表情识别中的应用。作者结合真实数据与噪声建模，提出了一种基于概率密度函数优化...

精选资源

【计算机视觉】Lecture9：立体视觉算法 计算机视觉.pdf

04-21

立体视觉算法计算机视觉 计算机视觉是一种使用计算机来模拟人类视觉的技术，立体视觉算法是计算机视觉中的一种重要技术。立体视觉算法的主要任务是从两个或多个图像中恢复三维场景的信息。这种技术有许多实际应用，...

精选资源

计算机视觉：朗伯光度立体法（Lambertian Photometric Stereo）

12-16

基于Matlab使用光度立体法对bear、buddha、cat和pot四类图像进行处理，同时考虑到阴影和高光的影响，按照一定比例删除最亮和最暗的像素点，利用最小二乘法最后得到Albedo图、Normal图和Re-rendered图（当观察方向和...

利用立体视觉计算图像深度的完整过程和原理

weixin_35748962的博客

02-18

570

利用立体视觉计算图像深度的完整过程可以分为三个主要部分：特征提取、匹配和深度估计。首先，利用特征提取算法从双目图像中提取出一组有效的特征点，然后通过匹配算法找到不同图像中的对应特征点，最后，通过深度估计算法来估计每个特征点的深度。原理上，立体视觉计算图像深度的过程主要利用立体视觉来实现，即利用两只眼睛的视觉角度差异，结合三角测量法，由两帧图像中的特征点的对应关系和左右眼图像的视差计算出每个特征点的...

双目相机——视差学习(立体视觉的学习)

weixin_43731435的博客

10-12

1827

demo 是对于想自己尝试拍摄双目图片进行立体匹配获取深度图，进行三维重建等操作的童鞋来讲，要做的工作是比使用校正好的标准测试图像对要多的。因此博主觉得有必要从用双目相机拍摄图像开始，捋一捋这整个流程真实场景的双目立体匹配（Stereo Matching）获取深度图详解 OpenCV3.4中的两种立体匹配算法效果比较：http://www.cnblogs.com/riddick/p/8318997.html 。以及利用视差图合成新视点： http://www.cnblogs.com/riddick/p/

计算机视觉基础--立体视觉&图像聚类

eating的博客

09-28

1744

1.立体视觉 立体视觉是一种计算机视觉技术，其目的是从两幅或两幅以上的图像中推理出图像中每个像素点的深度信息。应用领域：机器人、辅助驾驶/无人驾驶、无人机等 立体视觉的原理： 立体视觉借鉴了人类双眼的“视差”原理，即左、右眼对于真实世界中某一物体的观测是存在差异的，我们的大脑正是利用左、右眼的差异，使得我们能够辨识物体的远近。（视差）单目系统注：P、Q是现实世界中两个真实的点，即需要照的点当只有一个相机时，P、Q在成像平面的一个点上，判断不出两者的距离或两者离摄像机的距离差异。双目系统–即有两

（十五）立体视觉

m0_43609475的博客

01-28

949

立体视觉 立体视觉是双眼观察景物能分辨物体远近形态的感觉。因此实现立体视觉是要求我们根据相机的成像来计算出成像点到相机的距离。因此需要视觉测距算法何为立体视觉： 立体视觉是一种计算机视觉技术，其目的是从两幅或两幅以上的图像中推理出图像中每个像素点的深度信息。 立体视觉的应用领域：机器人、辅助驾驶/无人驾驶、无人机等等。 立体视觉的原理： 立体视觉借鉴了人类双眼的“视差”原理，即左、右眼对于真实世界中某一物体的观测是存在差异的，我们的大脑正是利用了左、右眼的差异，使得我们能够辨识物体的远近。（视差）

计算机视觉——双目视觉匹配计算视差深度

小唐要努力的博客

10-28

7037

一、基本原理 Stereo双目立体匹配有很多算法，比如SAD、BM、SGBM、GC，差别在于匹配时候的策略不同，我们这次要用到的NCC度量就是一种不错的方法。其中I为目标图像，T为模板图像，模板大小为M*N。 NCC的基本思想就是，从左边图像选取一个区域块，在右边目标图像某个范围内滑动，计算相似度ncc记录到对应的滑动距离中，然后选择相似度最高的距离d作为这个区域块的视差d即两幅图像这个相同区域所处像素值的差值，计算完所有区域之后的就可以得到一个视差图，根据相机的内置参数既可以求出深度图。

双目相机--双目视差与深度距离关系推导详解

wangxiaokun671903的专栏

07-31

1万+

相机成像的模型如下图所示： P为空间中的点，P1和P2是点P在左右像平面上的成像点，f是焦距，OR和OT是左右相机的光心。由下图可见左右两个相机的光轴是平行的。XR和XT是两个成像点在左右两个像面上距离图像左边缘的距离。

计算机视觉·DETR

2301_80132162的博客

11-30

150

由于N的数量肯定是大于图像中真实锚框的数量和标签集M，因此作者引入了一个No Object作为新的标签集。，这N个锚框经过FFN分别得到分类结果和锚框坐标。这些query向量首先经过自注意力进行交互。总损失：N个分类损失，M个锚框和GIoU损失。DETR设计了N个可以学习的query。就像NMS一样，作者需要减少锚框的数量。首先通过CNN+1x1卷积得到特征图，，N的数量大于图像中实际存在的数量。，其中N=100，表示查询的数量。得到生成的锚框与真实锚框之间的。，就是一个关系矩阵C。

OpenCV(三十四)：绘制轮廓