闵可夫斯基距离
设特征空间X是n维实数向量空间RnRn,
xi,xj∈X,xi=(x(1)i,x(2)i,...x(l)i)T,xj=(x(1)j,x(2)j,...x(l)j)T,xi,xj的Lp距离定义为xi,xj∈X,xi=(xi(1),xi(2),...xi(l))T,xj=(xj(1),xj(2),...xj(l))T,xi,xj的Lp距离定义为
Lp(xi,xj)=(∑l=0n∣∣x(l)i−x(l)j∣∣p)1pLp(xi,xj)=(∑l=0n|xi(l)−xj(l)|p)1p
欧氏距离
当p=2时为欧式距离,它是最常见的两点之间或多点之间的距离表示法,又称之为欧几里得度量,定义于欧几里得空间中,对应L2L2范数。如点x=(x1,...,xn)和y=(y1,...,yn)x=(x1,...,xn)和y=(y1,...,yn) 之间的距离为:
曼哈顿距离
p=1时为曼哈顿距离,对应L1L1范数,即在欧几里得空间的固定直角坐标系上两点所形成的线段对轴产生的投影的距离总和。
L1(xi,xj)=∑l=0n∣∣x(l)i−x(l)j∣∣L1(xi,xj)=∑l=0n|xi(l)−xj(l)|
在机器学习中的应用
L1范数和L2范数,用于机器学习的L1正则化、L2正则化。对于线性回归模型,使用L1正则化的模型建叫做Lasso回归,使用L2正则化的模型叫做Ridge回归(岭回归)。
其作用是:
L1正则化是指权值向量w中各个元素的绝对值之和,可以产生稀疏权值矩阵(稀疏矩阵指的是很多元素为0,只有少数元素是非零值的矩阵,即得到的线性回归模型的大部分系数都是0. ),即产生一个稀疏模型,可以用于特征选择;
L2正则化是指权值向量w中各个元素的平方和然后再求平方根,可以防止模型过拟合(overfitting);一定程度上,L1也可以防止过拟合。