计算机视觉中的数学基础
1 线性代数简要回顾
线性代数是计算机视觉中不可或缺的一部分,它为我们提供了处理图像和数据的强大工具。为了更好地理解计算机视觉中的算法和技术,有必要回顾一下线性代数中的关键概念。
1.1 向量和矩阵操作
向量和矩阵是线性代数的核心概念。通常,我们用粗体小写字母表示向量,用小写斜体罗马字母表示标量,用大写罗马字母表示矩阵。例如:
[ \mathbf{x} = \begin{bmatrix} x_1 \ x_2 \ x_3 \end{bmatrix} ]
向量的内积(点积)是一个标量,其值是两个向量对应元素乘积的总和:
[ \mathbf{x}^T \mathbf{y} = \sum_{i} x_i y_i ]
外积生成一个矩阵:
[ \mathbf{x} \otimes \mathbf{y} = \mathbf{x} \mathbf{y}^T = \begin{bmatrix} x_1 y_1 & x_1 y_2 & x_1 y_3 \ x_2 y_1 & x_2 y_2 & x_2 y_3 \end{bmatrix} ]
向量积(叉积)返回一个向量:
[ \mathbf{x} \times \mathbf{y} = \begin{bmatrix} 0 & -x_3 & x_2 \ x_3 & 0 & -x_1 \ -x_2 & x_1 & 0 \end{bmatrix} \begin{bmatrix} y_1 \ y_2 \ y_3 \