最小距离法是分类方法中最简单的方法之一
当想要判断一个新的样本向量的类别的时候,就去计算它与各类别的代表向量的距离即可
求每一类的代表向量
设一个样本集有 p 类样本
设第
其代表向量一般为这些样本的均值向量,即
ωim=1k(ωi1+ωi2+...+ωik)
计算距离
设需判断的样本为ω,则接下来需要计算出p个距离出来,然后比较出哪个距离最小,就把该样本判定为距离最近的那一类
d1=d(ω,ω1m)
d2=d(ω,ω2m)
…
dp=d(ω,ωpm)
然后看min{d1,d2,...,dp}属于哪一类
几种距离
至于两个向量的距离的计算,有好几种,最常见的是欧氏距离
比如,若求ω1和ω2的距离
设ω1为(x1,x2...xn),是个n维向量
设ω2为(y1,y2...yn),是个n维向量
欧氏距离=∑k=1n(xk−yk)2−−−−−−−−−−−√=(ω1−ω2)(ω1−ω2)T−−−−−−−−−−−−−−−−√,这里ω是个行向量
曼哈顿距离=∑k=1n|xk−yk|
闵可夫斯基距离=∑k=1n(xk−yk)r−−−−−−−−−−−√r
欧氏距离和曼哈顿距离是闵可夫斯基距离的特例。表示r=2和r=1的时候的特例。
本文介绍了一种简单的分类方法——最小距离法。通过计算待分类样本与各已知类别代表样本间的距离来确定其归属,详细解释了如何选取代表样本及计算不同类型的向量距离。
491

被折叠的 条评论
为什么被折叠?



