学习来源:《矩阵分析与应用》张贤达 清华大学出版社
1. 内积与范数
1.1 向量的内积
根据元素取值方式的不同,向量分为常数向量、函数向量和随机向量。常数向量是元素为常数的向量;函数向量是元素取某个变量的函数值得向量;而随机向量则是元素为随机变量的向量。
设 为向量空间,函数
称为向量
与
的内积,对所有的
,有:
1) ;
2) ,当且仅当
;
3) ;
4) ;
5) 。
1.2 常数向量的内积
两个 维常数向量
和
的内积定义为:
两个向量之间的夹角定义为:
当向量 与向量
的内积为0时,
和
正交。
1.3 常数向量的范数
L-P范数:是一组范数,定义如下:
在机器学习中常用到L1范数和L2范数:
1)L1范数对应 L-P 范数中 P 为 1 的情况:
2)L2范数对应 L-P 范数中 P 为 2 的情况:
1.4 函数向量的内积与范数
若 和
分别是变量
的函数向量,则他们的内积定义为:
函数向量的范数为:
1.5 随机向量的内积与范数
若 和
分别是样本变量
的随机向量,则它们的内积定义为:
随机向量 的范数定义为:
2. 向量的相似度
考虑 个类型的模式,假定已经抽取出对应的
个样本模式向量
。给定一个未知模式向量
,判断
属于哪一类模式。这个问题称为模式分类,模式分类的基本思想是将未知模式向量
和
个样本模式向量进行对比,看
与哪一个样本模式向量最相似,并据此作出模式分类的判断。
2.1 Euclidean 距离
最简单和最直观的相似度是两个向量之间的 Euclidean 距离。未知模式向量 与第
个已知模式向量
之间的 Euclidean 距离记作
,定义为:
将未知类型的模式向量 归为使得
最小的
的类别。
2.2 Mahalanobis 距离
令
代表 个样本模式向量的均值向量,并用
表示 个样本模式向量的协方差矩阵。从未知模式向量
到均值向量
之间的 Mahalanobis 距离定义为:
类似地,从第 个样本模式向量
到均值向量
的 Mahalanobis 距离定义为:
根据近邻分类法,将未知模式向量 归为满足:
的近邻 所属的模式类型。
2.4 向量夹角的余弦函数
两个向量之间的相似度不一定局限于距离函数。两个向量的夹角的余弦函数:
也是相似度的一种有效测度。