机器学习的数学基础 PART ONE
1. 标量 (Scalar):
单个数据,如1,2,3,4。
2. 向量 (Vector):
向量是一个有方向有大小的量,通常表示为由数值排列成的一维数组。
一维数组,将多个标量按照一定的顺序排列成一行或一列,如:[1,2,3,4]。
向量通常使用小写字母加粗体来表示,如x, a, b, v, u。
2.1 向量的长度
向量的长度叫模长,模长是一个映射,它把一个n维的向量变成了实数。
“模”字本身有标准、规范的意思。比如模型、模具这种词,就是一种标准的容器。而“范”字也有模子的意思,所以这两个字的选取都在表达这个数学概念,在测量一种东西。有个词叫“模范”,之前叫模长,现在叫范数。
3. 矩阵 (Matrix):
二维数组,成行成列的一堆数据。矩阵通常使用大写、斜体、粗体表示,如A, B, V, X。
从数据的角度来看,矩阵可以表示为一个包含行和列的数据表,每个单元格中的数值可以代表某种测量结果、观察值或特征。比如鸢尾花iris的样本集中,每一行表示一个样本,150行表示有150个鸢尾花的样本;每一列表示一个特征,4列表示鸢尾花有4个特征,分别是花萼长度、花萼宽度、花瓣长度和花瓣宽度。
从统计学的角度来看,矩阵可以用于描述多个变量之间的关系。例如,协方差矩阵用于衡量变量之间的相关性,而相关矩阵则提供了变量之间的线性相关性度量。使用这些矩阵来推断模式、关联和依赖性,以及进行数据分析和建模。
从线性代数的角度来看,矩阵可以用于表示线性方程组的系数矩阵。通过矩阵运算,例如矩阵乘法、求逆和特征值分解,可以解决线性方程组、求解特征向量和特征值等问题。 线性代数中的矩阵理论提供了处理线性关系的强大工具。
从几何学的角度来看,矩阵可以用于表示几何变换。通过将向量表示为矩阵的列或行,可以应用平移、旋转、 缩放等几何变换。矩阵乘法用于组合多个变换,从而实现更复杂的几何操作。 在计算机图形学和计算机视觉中,矩阵在处理和表示二维或三维对象的位置、方向和形状方面起着重要作用。