机器人技术讲座6：坐标变换与齐次坐标变换

原创于 2025-07-29 12:55:21 发布 · 923 阅读

CC 4.0 BY-SA版权

部署运行你感兴趣的模型镜像

简介：《机器人技术视频讲座》系列讲解了机器人技术中关键的坐标变换知识。坐标变换是机器人运动学的基础，允许在不同坐标系之间转换坐标，是控制机器人精确动作的关键。齐次坐标变换通过一个4x4矩阵简化位置和方向的变换，包括平移、旋转和缩放。讲座内容涵盖平移变换、旋转变换、齐次坐标、齐次坐标变换的性质、多级坐标变换、实际应用以及机器人运动学方程。学习这些内容，为深入研究机器人控制和路径规划打下基础。

1. 坐标系概念及应用

在计算机图形学、机器人技术以及物理模拟中，坐标系是表示和计算空间位置的基础工具。理解坐标系及其相关概念对于涉及这些领域的IT专家来说至关重要。本章首先从坐标系的基本概念入手，逐步深入到坐标系在实际应用中的重要性。

1.1 坐标系的基本概念

一个坐标系由一个原点、一组基向量和一个度量单位构成。在二维空间，我们通常使用笛卡尔坐标系，其由一个原点和两个互相垂直的基向量定义。而在三维空间中，除了原点和基向量，还需要指定一个右手规则以区分不同空间方向。

1.2 坐标系的重要性

在计算机图形学中，坐标系用于定位物体的位置、计算物体间的相对位置关系以及进行三维渲染时的视角转换。在机器人技术中，坐标系不仅用于精确控制机械臂等执行器的位置和方向，也是进行路径规划、碰撞检测等任务的基础。

1.3 应用实例

例如，在自动驾驶汽车中，多个坐标系被用来表示车辆的动态位置、地图信息以及周围障碍物的位置。通过坐标系的转换，汽车能够准确地进行定位，并对驾驶环境做出反应。这种应用的广泛性说明了深入理解坐标系对于IT专业人员的必要性。

2. 平移变换的矩阵表示

平移变换是一种基本的几何变换，它在图形学和机器人技术中有着广泛的应用。在这一章中，我们将会深入了解平移变换的理论基础，并通过编程实践来展示如何使用矩阵来表示二维和三维空间中的平移变换。

2.1 平移变换的理论基础

在探索平移变换的编程实现之前，让我们先来讨论一些基础的理论概念。

2.1.1 平移向量与变换矩阵的关系

平移变换可以通过向量来描述，其中平移向量规定了在特定方向上移动的距离。在二维空间中，一个点 (x, y) 经过平移变换后的结果可以通过以下方式计算：

x' = x + tx
y' = y + ty

其中， (tx, ty) 是平移向量。

而在三维空间中，一个点 (x, y, z) 的平移变换可以表示为：

x' = x + tx
y' = y + ty
z' = z + tz

其中， (tx, ty, tz) 是三维空间中的平移向量。

为了在矩阵运算中包含平移操作，引入了齐次坐标的概念。在齐次坐标中，一个点被表示为 (x, y, 1) ，而不是 (x, y) 。齐次坐标允许我们将平移变换合并到一个矩阵中，这样就可以通过矩阵乘法来进行变换。

2.1.2 平移变换的几何意义

平移变换在几何意义上非常直观，它意味着图形在空间中沿着一条直线移动了固定的距离。在二维空间中，这个操作可以想象为将图形向右或向左移动，向上或向下移动。在三维空间中，平移可以描述物体在一个方向上的线性移动，这在计算机图形学和机器人技术中是十分常见且重要的。

2.2 平移变换的编程实践

下面，我们将通过具体的编程示例来展示如何实现二维和三维空间中的平移变换。

2.2.1 实现二维平移变换的代码示例

为了实现二维平移变换，我们首先需要定义一个变换矩阵。在齐次坐标下，一个二维平移变换矩阵可以表示为：

T2D = | 1  0  tx |
      | 0  1  ty |
      | 0  0   1 |

接下来，我们将编写一个 Python 函数，使用 NumPy 库来创建这个变换矩阵，并将其应用于一个点上：

import numpy as np

def translate_2d(point, tx, ty):
    T = np.array([[1, 0, tx],
                  [0, 1, ty],
                  [0, 0, 1]])
    homogeneous_point = np.append(point, 1)
    transformed_point = T @ homogeneous_point
    return transformed_point[:2]  # 返回变换后的二维点

# 示例使用
point = np.array([2, 3])
translated_point = translate_2d(point, tx=5, ty=3)
print(translated_point)  # 输出: [7, 6]

2.2.2 实现三维平移变换的代码示例

三维空间中的平移变换稍微复杂一些，变换矩阵可以表示为：

T3D = | 1  0  0  tx |
      | 0  1  0  ty |
      | 0  0  1  tz |
      | 0  0  0   1 |

现在，我们将使用 Python 和 NumPy 来实现三维平移变换的函数：

def translate_3d(point, tx, ty, tz):
    T = np.array([[1, 0, 0, tx],
                  [0, 1, 0, ty],
                  [0, 0, 1, tz],
                  [0, 0, 0, 1]])
    homogeneous_point = np.append(point, 1)
    transformed_point = T @ homogeneous_point
    return transformed_point[:3]  # 返回变换后的三维点

# 示例使用
point = np.array([2, 3, 4])
translated_point = translate_3d(point, tx=5, ty=1, tz=-2)
print(translated_point)  # 输出: [7, 4, 2]

在以上示例中，我们展示了如何使用矩阵乘法来进行平移变换。通过这种方式，我们可以将平移和其他类型的变换（如旋转、缩放）组合起来，实现更加复杂的几何变换操作。

3. 旋转变换的不同表示方法

3.1 旋转变换的理论基础

3.1.1 旋转矩阵的构建原理

旋转矩阵是线性代数中用于描述旋转的矩阵。在二维空间中，一个点经过旋转变换后的位置可以通过一个旋转矩阵乘以该点的坐标向量得到。旋转矩阵必须满足正交性质，即它的转置矩阵等于它的逆矩阵，确保可以进行逆向旋转回到原点。

对于二维空间，以逆时针旋转为例，旋转角度为θ的旋转矩阵可以表示为：

| cosθ  -sinθ |
| sinθ   cosθ |

这个矩阵使得原点不变，而其它点按照角度θ逆时针旋转。类似地，三维空间中的旋转变换可以用3x3的旋转矩阵来描述，其中旋转轴可以是任意方向。

3.1.2 不同轴旋转的特点分析

在三维空间中，根据旋转轴的不同，可以有三种基本的旋转方式：

绕x轴旋转：这种旋转将改变点在y和z轴上的坐标，保持x坐标不变。
绕y轴旋转：该旋转将改变点在x和z轴上的坐标，保持y坐标不变。
绕z轴旋转：该旋转将改变点在x和y轴上的坐标，保持z坐标不变。

每种旋转都具有其独特的旋转矩阵，这些矩阵可以通过将旋转轴与相应的单位向量对齐来获得。比如绕z轴的旋转矩阵为：

| cosθ  -sinθ  0 |
| sinθ   cosθ  0 |
| 0       0     1 |

下面的代码块展示了一个二维旋转变换的实现，旋转变换围绕原点进行：

import numpy as np

def rotate_2d(theta):
    """
    二维旋转变换函数，返回旋转矩阵。
    参数theta为旋转角度。
    """
    return np.array([[np.cos(theta), -np.sin(theta)],
                     [np.sin(theta),  np.cos(theta)]])

# 示例：绕原点旋转45度
angle = np.radians(45)
rotation_matrix = rotate_2d(angle)

print("旋转变换矩阵为：")
print(rotation_matrix)

旋转变换矩阵构建的原理涉及三角函数及向量运算，对于给定旋转角度，矩阵的元素计算精确，保持了旋转的线性特性。

3.2 旋转变换的编程实践

3.2.1 实现二维旋转变换的代码示例

旋转矩阵构建之后，可以轻松地应用到二维坐标点的变换中。以下代码展示了如何使用构建的旋转矩阵对一个二维点进行旋转变换：

def apply_2d_rotation(point, rotation_matrix):
    """
    应用二维旋转变换到一个点。
    参数point为一个二维点的坐标，rotation_matrix为旋转矩阵。
    返回旋转后的新坐标。
    """
    return np.dot(rotation_matrix, point)

# 测试点
point = np.array([1, 0])

# 应用旋转变换
rotated_point = apply_2d_rotation(point, rotation_matrix)
print("旋转后的点坐标为：")
print(rotated_point)

3.2.2 实现三维旋转变换的代码示例

类似地，三维空间的旋转变换可以通过扩展到3x3旋转矩阵来实现。以下是一个围绕z轴旋转的三维旋转变换代码实现：

def rotate_3d_z(theta):
    """
    三维z轴旋转变换函数，返回旋转矩阵。
    参数theta为旋转角度。
    """
    return np.array([[np.cos(theta), -np.sin(theta), 0],
                     [np.sin(theta),  np.cos(theta), 0],
                     [0, 0, 1]])

# 示例：绕z轴旋转45度
angle = np.radians(45)
rotation_matrix_3d_z = rotate_3d_z(angle)

print("三维z轴旋转变换矩阵为：")
print(rotation_matrix_3d_z)

# 测试点
point_3d = np.array([1, 0, 1])

# 应用三维旋转变换
rotated_point_3d = apply_2d_rotation(point_3d[:2], rotation_matrix_3d_z[:2, :2])
rotated_point_3d = np.append(rotated_point_3d, point_3d[2])
print("三维旋转后的点坐标为：")
print(rotated_point_3d)

在上述示例中，首先定义了一个创建z轴旋转矩阵的函数 rotate_3d_z 。然后定义了一个将二维点应用到旋转矩阵的函数 apply_2d_rotation ，对于三维点的处理稍加修改，只使用旋转矩阵的前两行两列。这样可以处理在三维空间中的二维投影旋转。

这些代码展示了旋转变换的基本实现，以及如何将理论应用到实际编程中。在后续的章节中，我们将会讨论这些变换在更复杂场景下的应用，例如机器人技术中的坐标变换。

4. 齐次坐标的原理和应用

4.1 齐次坐标的基本概念

4.1.1 齐次坐标与欧几里得坐标的对比

齐次坐标是一种数学工具，它扩展了传统的欧几里得坐标系统，使其能够更方便地表达几何变换。在二维空间中，欧几里得坐标由一对(x, y)表示，而在齐次坐标系统中，我们使用(xh, yh, h)来表示同一个点，其中h是一个非零的缩放因子。在没有缩放的情况下，h常取值为1，此时齐次坐标退化为欧几里得坐标。

齐次坐标的引入为坐标变换提供了便利，尤其是在处理平移、旋转和缩放等变换时，可以使用相同形式的矩阵进行操作。例如，平移操作在齐次坐标系中可以通过矩阵乘法来表示，而在欧几里得坐标系中则需要单独的平移公式。

4.1.2 齐次坐标的几何意义

齐次坐标的几何意义在于它提供了一种统一的框架来处理各种几何变换。在齐次坐标中，无穷远点可以通过设置h=0来表示，这在传统欧几里得坐标系中是不可能的。此外，齐次坐标允许我们在不改变坐标值的情况下进行更自由的变换，因为它考虑了缩放因子h。

举个例子，考虑一个点在二维空间中的位置，它在欧几里得坐标系中为(2, 3)。在齐次坐标系中，我们可以表示为(2, 3, 1)。当我们对这个点进行缩放时，比如缩放因子为2，那么在欧几里得坐标系中我们需要计算新的x和y值，而在齐次坐标系中只需将第三个坐标（即缩放因子）乘以2，得到(4, 6, 2)。

4.2 齐次坐标的实用场景

4.2.1 齐次坐标在机器人视觉中的应用

在机器人视觉中，齐次坐标提供了强大的数学工具来处理图像中的坐标变换。比如在图像变换中，将三维场景投影到二维图像平面上的过程可以通过齐次坐标简化为矩阵乘法，这是计算机图形学中常见的操作。

更具体地说，当摄像头捕捉到三维场景中的点时，这些点首先被映射到一个虚拟的二维平面上，然后再被投影到相机的成像平面上。在这一过程中，可以使用齐次坐标和变换矩阵来统一表示这些连续的变换，简化了计算过程。

4.2.2 齐次坐标在三维建模中的作用

在三维建模中，齐次坐标同样扮演着重要角色。它们用于定义三维对象在四维空间中的表示，使得模型可以更容易地进行平移、旋转和缩放操作。

考虑一个三维模型的变换，比如将一个物体在三维空间中移动到一个新的位置。在使用齐次坐标的情况下，我们只需要应用一个四维变换矩阵，而不是单独对每个坐标轴上的点进行计算。这样的操作在几何变换频繁的三维动画制作和模拟仿真中尤其有用。

为了更加深入理解齐次坐标的原理和应用，我们来看一个具体的案例分析：

实例分析：使用齐次坐标进行三维变换

假设我们有一个三维模型，我们想要将这个模型沿z轴旋转θ度，并在x轴和y轴方向上分别平移Tx和Ty单位。在齐次坐标下，我们可以将这个变换表示为一个4x4的矩阵。

[ M_{total} = M_{rotation} \times M_{translation} ]

首先，我们构建旋转矩阵和平移矩阵：

[ M_{rotation} = \begin{bmatrix}
cos(\theta) & -sin(\theta) & 0 & 0\
sin(\theta) & cos(\theta) & 0 & 0\
0 & 0 & 1 & 0\
0 & 0 & 0 & 1
\end{bmatrix} ]

[ M_{translation} = \begin{bmatrix}
1 & 0 & 0 & Tx\
0 & 1 & 0 & Ty\
0 & 0 & 1 & 0\
0 & 0 & 0 & 1
\end{bmatrix} ]

将这两个矩阵相乘后，我们得到的矩阵M_total包含了旋转和平移的全部变换信息。然后，我们可以将模型上任意一点的齐次坐标与M_total相乘，得到变换后的新坐标。

[ \begin{bmatrix}
x’\
y’\
z’\
1
\end{bmatrix} = M_{total} \times \begin{bmatrix}
x\
y\
z\
1
\end{bmatrix} ]

这就是齐次坐标在三维建模中实际应用的一个例子，它表明齐次坐标不仅在理论上是方便的，而且在实际操作中也具有很大的优势。

通过上述分析，我们可以看到齐次坐标为处理复杂的几何变换提供了非常有用的工具，并且在机器视觉和三维建模等领域有着广泛的应用。接下来，我们将探讨齐次坐标在更复杂的机器人技术中的综合应用。

5. 坐标变换在机器人技术中的综合应用

5.1 多级坐标变换的理论与实践

5.1.1 多级变换的矩阵串联

在机器人技术中，坐标变换通常涉及到多个变换的组合，这通常被称为多级变换。理解多级变换，首先需要掌握矩阵的串联方法，矩阵串联是指将多个变换矩阵依次相乘，得到一个综合变换矩阵，这个矩阵可以一次性应用于点或向量，以完成复杂的坐标变换。

例如，假设有一个二维点的平移和旋转变换，首先进行旋转变换，再进行平移变换。旋转变换矩阵为：

R(\theta) = 
\begin{bmatrix}
\cos\theta & -\sin\theta \\
\sin\theta & \cos\theta
\end{bmatrix}

平移变换矩阵为：

T = 
\begin{bmatrix}
1 & 0 & t_x \\
0 & 1 & t_y \\
0 & 0 & 1
\end{bmatrix}

若要先旋转变换再平移变换，则综合变换矩阵为 T*R 。相反，若要先平移后旋转，则矩阵为 R*T 。矩阵乘法不满足交换律，所以先后顺序很重要。

5.1.2 实际案例分析：机械臂的坐标变换

考虑一个具有多个关节的机械臂，每个关节可以看作是在进行一次坐标变换。为了控制机械臂末端到达指定位置，需要计算出一系列关节角度的变化。这要求我们能够将每个关节的局部变换串联起来，最终得到从基座到机械臂末端的总变换矩阵。

假设一个简单的两关节机械臂，关节一负责旋转，关节二负责前后移动。关节一的旋转变换矩阵为 R1 ，关节二的平移变换矩阵为 T2 。为了计算末端执行器（例如夹爪）的位置，我们需要将这两个变换矩阵串联：

T_{total} = T2 * R1

然后将这个综合变换矩阵应用到基座的坐标系中，即可得到末端执行器在基座坐标系中的位置。

5.2 机器人运动学方程的构建

5.2.1 运动学方程的理论基础

机器人的运动学方程描述了机器人各个关节变量与机器人末端执行器位置和姿态之间的关系。正向运动学问题是指已知关节变量求末端执行器的位置和姿态。而逆向运动学则相反，是已知末端执行器位置和姿态，求解需要关节变量。

正向运动学可以通过前面介绍的坐标变换矩阵串联轻松求解。例如，对于一个两关节机械臂，末端执行器的位置 (x, y) 可以通过下面的方程获得：

x = T_{total}[1,3]
y = T_{total}[2,3]

其中 T_{total} 是综合变换矩阵。

5.2.2 运动学方程在编程中的实现

在编程实现运动学方程时，需要将数学公式转化为可执行的代码。对于正向运动学，可以通过定义函数来计算末端执行器的位置：

def forward_kinematics(theta1, theta2, d1, d2):
    # 定义旋转和移动矩阵
    R1 = matrix_rotation(theta1)
    T2 = matrix_translation(0, 0, d2)
    # 串联变换矩阵
    T_total = multiply_matrices(T2, R1)
    # 提取末端执行器位置
    x = T_total[0][2]
    y = T_total[1][2]
    return x, y

对于逆向运动学，问题变得更复杂，可能需要解析方法或数值方法求解。实现细节通常涉及到复杂数学运算，可能需要借助专门的数学库。

5.3 编程实现机器人控制

5.3.1 编程语言的选择与准备

编程语言的选择对于机器人控制至关重要。C++、Python和ROS等语言和框架因其高性能和丰富库支持而在机器人领域广泛使用。在选择编程语言之前，需要考虑项目需求、性能要求和团队熟悉度等因素。

准备编程环境时，需要安装必要的库和依赖，例如使用Python的numpy库进行矩阵运算，或者ROS进行机器人控制。

5.3.2 坐标变换代码的实际编程实现

实际编程时，我们将理论知识转化为代码。以Python为例，可以使用numpy库来实现矩阵操作，计算出在一系列坐标变换后，机器人末端执行器的位置。以下是一个简单的代码实现：

import numpy as np

# 定义2D旋转变换矩阵
def matrix_rotation(theta):
    return np.array([
        [np.cos(theta), -np.sin(theta)],
        [np.sin(theta), np.cos(theta)]
    ])

# 定义2D平移变换矩阵
def matrix_translation(tx, ty):
    return np.array([
        [1, 0, tx],
        [0, 1, ty],
        [0, 0, 1]
    ])

# 计算综合变换矩阵
def multiply_matrices(T1, R1):
    return np.dot(T1, R1)

# 假设两个变换矩阵
T1 = matrix_translation(0, 1)
R1 = matrix_rotation(np.pi / 4)

# 计算综合变换后的末端执行器位置
T_total = multiply_matrices(T1, R1)
x, y = T_total[0][2], T_total[1][2]

print(f"End-effector position: x={x}, y={y}")

以上代码实现了二维空间中的坐标变换，并计算了末端执行器的位置。在实际机器人控制中，类似的计算会更加复杂，涉及更多的变换和维度，但基本原理和步骤是相似的。

本文还有配套的精品资源，点击获取

您可能感兴趣的与本文相关的镜像

AutoGPT

AI应用

AutoGPT于2023年3月30日由游戏公司Significant Gravitas Ltd.的创始人Toran Bruce Richards发布,AutoGPT是一个AI agent（智能体），也是开源的应用程序，结合了GPT-4和GPT-3.5技术，给定自然语言的目标，它将尝试通过将其分解成子任务，并在自动循环中使用互联网和其他工具来实现这一目标