常用的距离有:欧式距离、马氏距离、曼哈顿距离、汉明距离。下面进行分别介绍。
1. 欧氏距离
欧氏距离又称为欧几里得度量(euclidean metric)。通常在二维平面或者三维空间中两点间的直线距离就是欧氏距离。在n维空间下的一个点可以表示为(x 1 ,x 2 ,...,x n ) (x1,x2,...,xn).设在n维空间有A、B两点,相应的坐标分别为(a 1 ,a 2 ,...,a n ) (a1,a2,...,an),(b 1 ,b 2 ,...,b n ) (b1,b2,...,bn),则A、B两点的欧氏距离d d的计算公式如下:
2. 马氏距离
马氏距离(Mahalanobis distance)是用来度量一个样本点P与数据分布为D的集合的距离。
3. 曼哈顿距离
曼哈顿距离(Manhattan distance)又称出租车距离。
4. 汉明距离
汉明距离是使用在数据传输差错控制编码里面的,汉明距离是一个概念,它表示两个(相同长度)字对应位不同的数量,我们以d(x,y)表示两个字x,y之间的汉明距离。对两个字符串进行异或运算,并统计结果为1的个数,那么这个数就是汉明距离。