计算机视觉中常用的坐标系

最新推荐文章于 2024-12-17 22:00:00 发布

翠绿寂静

最新推荐文章于 2024-12-17 22:00:00 发布

阅读量408

点赞数

CC 4.0 BY-SA版权

文章标签：计算机视觉人工智能

本文链接：https://blog.youkuaiyun.com/code_program481/article/details/132861496

机器学习-深度学习专栏收录该内容

146 篇文章 ¥59.90 ¥99.00

订阅专栏

本文详细阐述了计算机视觉中的四种关键坐标系：图像坐标系、世界坐标系、相机坐标系和规范化坐标系，以及它们在图像处理和物体定位中的应用。通过示例代码展示了坐标系之间的转换，帮助读者深入理解这些概念。

计算机视觉中常用的坐标系

在计算机视觉领域中，坐标系是一种重要的概念，用于描述图像或视频中的像素位置、物体边界框以及其他几何特征。常用的坐标系包括图像坐标系、世界坐标系、相机坐标系和规范化坐标系。本文将详细介绍这些坐标系，并提供相应的源代码示例。

图像坐标系（Image Coordinate System）:
图像坐标系是最常见的坐标系之一，用于描述图像中像素的位置。在图像坐标系中，图像的左上角是原点(0, 0)，水平向右为X轴正方向，垂直向下为Y轴正方向。坐标值以像素为单位，例如，(100, 200)表示位于水平方向100像素，垂直方向200像素的位置。

下面是一个使用Python和OpenCV库操作图像坐标系的示例代码：

import cv2

# 加载图像
image = cv2.imread('image.jpg')

# 获取图像尺寸
height,

了解本专栏

订阅专栏解锁全文

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

翠绿寂静

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

订阅专栏

计算机视觉 常用坐标系一览

学以致用知行合一

05-18

3380

在几何学中，坐标系是使用一个或多个数字或坐标来唯一确定点或其他几何元素在诸如欧几里得空间的流形上的位置的系统。坐标的顺序很重要，它们有时通过它们在有序元组中的位置来标识，有时通过字母标识，如“ x坐标”。坐标在初等数学中被视为实数，但可能是复数或更抽象系统的元素，例如交换环。使用坐标系可以将几何问题转化为数字问题，反之亦然；这是解析几何的基础。我们大多数人都熟悉笛卡尔坐标系，并在绘制点和绘制方程时使用它。但是还有许多其他坐标系被广泛应用于数学和其他领域。

一文读懂计算机视觉坐标系相机参数关系及相机标定

家鸽的代码屋

06-05

3381

计算机视觉坐标系关系及相机标定坐标系关系世界坐标系(World Coordinate)相机坐标系(Camera Coordinate) 坐标系关系世界坐标系(World Coordinate) 由于摄像机与被摄物体可以放置在环境中任意位置，这样就需要在环境中建立一个三维直角坐标系，来表示相机和被摄物体的位置，这个坐标系就称为世界坐标系 相机坐标系(Camera Coordinate) 相机坐标系也是一个三维直角坐标系，原点位于镜头光心处，X，Y轴分别与像平面的两边平行，Z轴为镜头光轴，与像平面垂直 ..

参与评论您还未登录，请先登录后发表或查看评论

机器视觉中的坐标系

baidu_38165415的博客

04-19

2984

这里的x和y是图像坐标系的坐标，单位是mm，也就是表示(x,y)坐标在像素坐标系下占据(u-Ocenterx)、(v-ocentery)个像素点，则一个像素点占据的mm数可以通过以上公式计算出来。上图中Oc是相机坐标系的原点，o点是图像坐标系的原点，p(x,y)是图像坐标系中的点，P(Xc,Yc,Zc)是p点在相机坐标系中对应的点。图像坐标系单位为mm, dx和dy分别表示每个像素在横轴x和纵轴y的物理尺寸，也就是分辨率，代表一个像素对应的实际距离（mm）.图像坐标系和像素坐标系的关系--矩阵形式。

【机器视觉1】坐标系定义

weixin_43387635的博客

05-15

2667

表示摄像机焦距，即三维空间中的一点经摄像机成像后，所投影到图像平面上的坐标在 X ，Y 方向上的缩放比例不一样。：为了选择一个基准坐标系来描述摄像机的位置，并用它描述环境中任何物体的位置，由。为投影矩阵，表征二维图像坐标与三维世界坐标间的基本关系。组成的直角坐标系称为摄像机坐标系。是该像素在图像数组中的列数和行数。

【CV】CV领域常用的坐标系(Coordinate Systems)

北境の守望者

07-12

2201

Ref Coordinate Systems

（二）图像坐标：我想和世界坐标谈谈(B) 【计算机视觉学习笔记--双目视觉的几何框架系列】

玉米的专栏

11-02

2万+

玉米将在这篇博文中，对图像坐标与世界坐标的这场对话中涉及的第二个问题：谈话方式，进行总结。世界坐标是怎样变换进摄像机，投影成图像坐标的呢？玉米做了一个简单的图示，在这里做一个提纲。图中显示，世界坐标系通过刚体变换到达摄像机坐标系，然后摄像机坐标系通过透视投影变换到达图像坐标系。可以看出，世界坐标与图像坐标的关系建立在刚体变换和透视投影变换的基础上。为了奖励刚体变和透视投影变换沟通了“世界上最远

总结|机器视觉中三大坐标系及其相互关系

3D视觉工坊

05-11

4404

点击上方“3D视觉工坊”，选择“星标”干货第一时间送达作者：林青春链接：https://zhuanlan.zhihu.com/p/59289459本文转载自知乎，作者已授权，未经许可请勿...

[计算机视觉] 相机成像模型之四个坐标系

wangmj_hdu的博客

11-10

1万+

世界坐标系、相机坐标系、图像坐标系、像素坐标系 1、四个坐标系简介世界坐标系：描述相机位置，(Xw,Yw,Zw) 相机坐标系：相机坐标系是连接图像物理坐标系与世界坐标系的桥梁，镜头的光心为原点，(Xc,Yc,Zc)，也是投影中心图像物理坐标系：相机坐标系的Z轴与图像的交点为原点，(x,y) 像素坐标系：图像的左上角为原点，单位pixel，（u,v）我们可以从拍摄的图片上一个点的坐标，利用相机内参外参，反推出世界中那个点的坐标，进行三维重建。构建世界坐标系是

计算机图形学-坐标系（坐标总汇）

小道士写程序

06-20

4750

计算机图形学中的坐标系统

计算机屏幕坐标系简介

cnds123的专栏

12-17

2539

计算机屏幕坐标系简介

计算机图形学——坐标系统

qq_43808588的博客

11-11

1891

1、概念为了将坐标从一个坐标系变换到另一个坐标系，我们需要用到几个变换矩阵，最重要的几个分别是模型(Model)、观察(View)、投影(Projection)三个矩阵。我们的顶点坐标起始于局部空间(Local Space)，在这里它称为局部坐标(Local Coordinate)，它在之后会变为世界坐标(World Coordinate)，观察坐标(View Coordinate)，裁剪坐标...

【计算机图形学】计算机图形学中的坐标系统

weixin_33813128的博客

11-10

1620

一、简介　　马三最近开始学习计算机图形学了，买了两本书，其中一本是国内的，还是什么大学的教材，不过写得真不咋样啊。另外一本是大名鼎鼎的《计算机图形学》第四版。最近接触了下计算机图形学中的坐标系统，做个笔记。二、计算机图形学中的坐标系统 1.建模坐标系（MC）　　建模坐标系是一个局部坐标系，同时可以是一个典型的平面直角坐标系，它的出现主要是为了模型构建与变换的方便。一般而言，我们总是习...

计算机图形学基础—坐标系

qq_45286905的博客

05-06

3376

一. 图形坐标系 计算机图形学中，从物体建模、设备显示、处理图形角度，使用一系列的坐标系，图形显示的过程就几何模型在不同坐标系之间的映射。 1. 世界坐标系：公共坐标系，是现实中物体场景的统一参照系 2. 建模坐标系：局部坐标系，独立于世界坐标系来定义物体的几何特性 3. 观察坐标系：从观察者的角度对整个世界坐标系内的对象进行重定定位和描述，用于指定图形的输出范围 4. 设备坐标系：适合特定输出设备输出对象的坐标系，一般，对于每个具体的显示设备，都有单独的坐标系统 5. 规范化坐标...

屏幕坐标系和窗口客户区坐标系最明显的区别

LJH0600301217的专栏

03-29

7787

屏幕坐标系和窗口客户区坐标系最明显的区别在于坐标原点，屏幕坐标系的坐标原点在整个屏幕的左上角，而窗口客户区坐标系的坐标原点在窗口客户区的左上角，通常这两个点是不重合的。一设备坐标和逻辑坐标　　设备坐标（Device Coordinate）又称为物理坐标（Physical Coordinate），是指输出设备上的坐标。通常将屏幕上的设备坐标称为屏幕坐标。设备坐标用对象距离窗口左上角

OpenCV学习——图像坐标系，相机坐标系和世界坐标系

坚果壳的学习之旅

08-08

1万+

OpenCV学习——图像坐标系，相机坐标系和世界坐标系

像素坐标系与图像坐标系

带着Bug看世界

06-09

1138

在数字图像处理中，经常会看到使用 `(x, y)` 表示图像中的某个像素点。在一些图像处理库，例如 `Pillow` 、`OpenCV` 、`Numpy` 中也会使用到坐标系处理图像的像素点。以左上角的点为原点(0, 0)横向为x轴；纵向为y轴；如图所示：其中原图为宽width，高height大小的图像，从(x, y)的位置截取宽w、高h大小的图像。

机器视觉（六）——像素坐标系、图像坐标系、相机坐标系以及世界坐标系

weixin_45661757的博客

04-06

6754

机器视觉（六）——像素坐标系、图像坐标系、相机坐标系以及世界坐标系 目录1. 像素坐标系2. 图像坐标系3.相机坐标系4.世界坐标系 1. 像素坐标系 如下图所示：像素坐标系u-v的原点为O0，横坐标u和纵坐标v分别是图像所在的行和列，在视觉处理库OpenCV中，u对应x，v对应y； 2. 图像坐标系 图像坐标系x-y的原点是O1，为像素坐标系的中点，如图所示：假设（u0，v0）代表O1在u-v坐标系下的坐标，dx和dy分别表示每个像素在横轴x和纵轴y的物理尺寸；则图像坐标系和像素坐标系的关系.

双目立体视觉中的坐标系与转换关系 [留意~摄影测量学与计算机视觉学科中的差异]

闲情逸致~

10-19

1万+

立体视觉三大坐标系：影像坐标系、相机坐标系、世界坐标系！

快速查看图片中某点的像素 X、Y 坐标

最新发布

07-02

在计算机视觉中，将一个点 $ P $ 转换到世界坐标系 $ P_w $ 的过程涉及多个步骤，通常包括从像素坐标系、图像物理坐标系、相机坐标系最终转换到世界坐标系。这个变换过程需要结合相机的内参和外参矩阵来完成。 ### 坐标变换的基本流程 1. **像素平面坐标系到图像物理坐标系** 从像素坐标 $ p = [u, v]^T $ 转换到图像物理坐标 $ P = [x, y]^T $，可以通过以下公式实现： $$ \begin{bmatrix} x \\ y \end{bmatrix} = \begin{bmatrix} \frac{u - c_x}{f_x} \\ \frac{v - c_y}{f_y} \end{bmatrix} $$ 其中，$ f_x $ 和 $ f_y $ 是相机在 $ x $ 和 $ y $ 方向上的焦距（以像素为单位），而 $ c_x $ 和 $ c_y $ 是图像主点（即光轴与成像平面交点）的像素坐标[^1]。 2. **图像物理坐标系到相机坐标系** 图像物理坐标系中的点 $ P = [x, y]^T $ 可以扩展为三维空间中的点 $ P_c = [X_c, Y_c, Z_c]^T $，其中 $ Z_c $ 表示该点在相机坐标系下的深度值。假设已知该点的深度信息，则可以使用如下关系： $$ \begin{bmatrix} X_c \\ Y_c \\ Z_c \end{bmatrix} = Z_c \begin{bmatrix} \frac{x}{f_x} \\ \frac{y}{f_y} \\ 1 \end{bmatrix} $$ 这里 $ f_x $ 和 $ f_y $ 是相机的物理焦距（以毫米或其他长度单位表示）[^1]。 3. **相机坐标系到世界坐标系** 相机坐标系中的点 $ P_c = [X_c, Y_c, Z_c]^T $ 可以通过旋转和平移操作转换到世界坐标系 $ P_w = [X_w, Y_w, Z_w]^T $。具体来说，该变换由旋转矩阵 $ R $ 和平移向量 $ T $ 组成，其数学表达式为： $$ P_w = R \cdot P_c + T $$ 或者更详细地写为： $$ \begin{bmatrix} X_w \\ Y_w \\ Z_w \end{bmatrix} = R \begin{bmatrix} X_c \\ Y_c \\ Z_c \end{bmatrix} + \begin{bmatrix} t_x \\ t_y \\ t_z \end{bmatrix} $$ 其中，$ R $ 是一个 $ 3 \times 3 $ 的旋转矩阵，描述了相机坐标系相对于世界坐标系的方向；$ T = [t_x, t_y, t_z]^T $ 是一个平移向量，表示相机原点在世界坐标系中的位置[^2]。 ### 实现方法 - **获取相机参数** 在进行坐标变换之前，必须先获得相机的内参和外参。内参包括焦距 $ f_x $、$ f_y $，以及主点 $ (c_x, c_y) $，这些参数可以通过相机标定工具（如 OpenCV 中的 `calibrateCamera` 函数）获得。外参则包括旋转矩阵 $ R $ 和平移向量 $ T $，它们描述了相机相对于世界坐标系的位置和方向。 - **应用变换公式** 根据上述公式逐步将像素坐标转换为世界坐标。例如，如果已知某个点的像素坐标 $ (u, v) $ 和深度值 $ Z_c $，可以通过以下步骤计算其在世界坐标系中的位置： ```python import numpy as np # 假设已知相机内参 fx = 500 # 焦距x方向（像素） fy = 500 # 焦距y方向（像素） cx = 320 # 主点x坐标（像素） cy = 240 # 主点y坐标（像素） # 已知的像素坐标和深度值 u = 320 v = 240 Zc = 1.0 # 深度值（米） # 计算图像物理坐标 x = (u - cx) / fx y = (v - cy) / fy # 计算相机坐标系中的坐标 Xc = x * Zc Yc = y * Zc Zc = Zc # 定义旋转矩阵R和平移向量T R = np.array([[1, 0, 0], [0, 1, 0], [0, 0, 1]]) # 单位矩阵表示相机与世界坐标系方向一致 T = np.array([0, 0, 0]) # 假设相机位于世界坐标系原点 # 将相机坐标系中的点转换到世界坐标系 Pc = np.array([Xc, Yc, Zc]) Pw = np.dot(R, Pc) + T print("世界坐标系中的坐标：", Pw) ``` ### 总结在计算机视觉中，将点 $ P $ 转换到世界坐标系 $ P_w $ 需要经过多个步骤，包括像素坐标到图像物理坐标的转换、图像物理坐标到相机坐标的转换，以及相机坐标到世界坐标的转换。整个过程依赖于相机的内参和外参，并且可以通过编程语言（如 Python）和相关库（如 OpenCV）实现。