最近邻分类器及MATLAB实现

本文详细介绍最近邻分类(KNN)的基本思想与数学原理,并通过MATLAB实现KNN算法,包括二维平面两类分类问题及鸢尾花数据集的分类实例。

应用背景:在前面一些图像处理相关的文章中,已经说到图像的特征提取,在选择好一些主要特征之后,那么我们用这些特征做什么用呢,我们的主要目的是利用这些特征对图像进行分类。接下来的问题是怎么分类,这里介绍最近邻分类,它是一种最简单的分类方法。

基本思想:最近邻分类,顾名思义,距邻居最近,则与邻居同类。也就是说,一个待分类的单个样本A,放入已分好类的多个样本群Q中,从Q中选择kA的邻居,通过计算A与邻居之间的某种关系后得出A与这k个邻居最相似,那么就把A分为这k个邻居中出现次数最多的类,因此最近邻分类也称k最近邻分类(k  nearest  neighbor,  KNN)。这种分类方法基本分类3步:1、找待分类样本与已分类样本之间的关系,这里指计算它们之间的距离;2、找距离最近的k个已分类的样本;3、分类,从这k个样本中找出出现次数最多的类,那么待分类样本属于该类。

数学原理:在特征空间中,把每个类的所有样本的平均值表示为该类,则第i类样本的均值为:

                                                                                                          (1)

其中,Ni为第i类样本的样本数目,Wi为第i类样本集合,W为总类别数目。

样本之间的距离取欧氏距离,当对一个未知模式 x 进行分类时,需要分别计算 x 与各个类的欧氏距离,如下式所示

                                                                    &n

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值