Open-CV K近邻算法(k-Nearest Neighbour)OCR手写识别

本文介绍了K近邻算法的基本原理,包括特征空间的概念和算法如何通过计算距离来进行分类。并通过一个手写数字识别的例子展示了算法的实际应用,实现了超过90%的识别准确率。

1.概念描述

1.1 什么是特征空间?

首先,K近邻算法是监督分类中最简单的算法,实际上也就是一个分类算法,另外分类也有很多很多种,例如一维空间物体的分类、二维空间物体的分类、三维空间物体的分类...被分类的物体所占据的空间叫做特征空间,例如你要分类的是一维物体,在数学上,它只有坐标x,那么一维空间就是它的特征空间,如果你要分类二维物体,数学上,它有(x,y),那么二维空间是它的特征空间。

1.2 K近邻算法是怎么分类的?

下面的图片就是二维空间物体的分类问题,我们很明显可以看出图中有两类。绿色的圆型是新添加的一个图形。

然后解释一下什么是K近邻算法的计算过程,由于OpenCV官方的教程过于形象,在此只做简单的翻译:

看上面的图片:我们究竟要把它放在红色的队伍里面,还是放在蓝色的队伍里面。

最起初的观点,我们直接把它放在红色里面,因为红色离他最近!(这就是近邻的意思)反驳的观点要说了,如果蓝色很多怎么办,那样我们就要重新考虑了,现在假设我们考虑距离它最近的三个邻居的颜色,决定它的分类,我们看到它周围最近的3个邻居中,红色2个>蓝色1个(蓝色虽然两个等距,但是限定了取最近的三个,所以蓝色取1个),那么它还是归红类,如果我们找它周围5个邻居呢,红色2个<蓝色3个,那就把它归为蓝色,如果7个邻居呢,红色2个<蓝色5个,归为蓝色类。从上面的分类过程中,我们就可以把选取邻居的个数抽象成K,这就是K近邻算法中K的含义。下面的表格把上面的分析过程整理了一下:

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Matrix_CS

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值