图像分类（一）—KNN算法概述（附代码）

Voxel_97

已于 2024-04-18 23:10:45 修改

阅读量2k

点赞数 23

分类专栏：图像分类文章标签：算法 python 图像处理

于 2024-04-14 19:33:07 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/lalalala97/article/details/137743159

版权

目录

目录

一、理论知识

1、什么是KNN？

2、KNN算法的计算逻辑

3、距离度量（重点）

3.1 曼哈顿距离（Manhattan Distance）

3.2 欧式距离（Euclidean Metric）

二、分类器构建（代码实现）

1、显示训练数据

2、创建KNN分类器

3、测试数据

三、参考书籍

一、理论知识

1、什么是KNN？

K—最近邻近算法（K- Nearest Neighbor, KNN）：假设在一平面（图1）内，存在两种已知的样本数据（训练数据）类型，我们把蓝色的方块定义为A类样本数据，把橙色的菱形定义为B类样本数据。然而，在图1中，我们可以发现还存在一个红色的圆形（待预测的数据），我们怎么样才能知道它到底是属于A类（蓝色方块）还是B类（橙色菱形）呢？

KNN算法可以很好的解决这个问题，其核心思想就是可以通过选择周围的k个“邻居”，在k个最邻近的样本数据中选择所占比例最高的类别赋予预测数据。

具体来说，假设k=3（虚线圆圈），A类数据所占比例为1/3，B类数据所占比例为2/3，所以红色的圆形被赋予为B类；假设k=8（实线圆圈），A类数据所占比例为5/8，B类数据所占比例为3/8，所以红色的圆形被赋予为A类。

图1 KNN算法

2、KNN算法的计算逻辑

从上面的例子，我们可以简单的总结KNN算法的计算逻辑：

计算训练数据与测试数据中每一个样本的距离（因为开始时，我们不知道哪些训练数据会成为最近的邻居，只有在计算出所有可能的距离之后，才能确定哪些是最近的k个邻居）；
选取距离测试数据最近的k个训练数据样本，作为“邻居”；
选择所占比例最高的类别赋予测试数据。

因此，可以发现有两个因素可以直接决定KNN算法的准确性：

k值（“邻居”数量）的选择
训练数据和测试数据中样本之间的距离

3、距离度量（重点）

在这里，对于k值（“邻居”数量）的选择先不展开赘述，主要探讨如何计算训练数据和测试数据中样本之间的距离。

3.1 曼哈顿距离（Manhattan Distance）

对于一个二维平面，假设有两个点 $\boldsymbol{\left ( x_1,y_1 \right )}$ 和 $\boldsymbol{\left ( x_2,y_2 \right )}$ 。这两点之间的曼哈顿距离为：

最低0.47元/天解锁文章

博客等级

码龄3年

4
原创

113
点赞

147
收藏

92
粉丝

关注

私信

热门文章

分类专栏

python基础知识学习 1篇
图像分类 3篇

最新评论

图像分类（三）— KNN算法实战之CIFAR10数据集+交叉验证（附代码）
普通网友: 好文，细节很到位！【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
图像分类（三）— KNN算法实战之CIFAR10数据集+交叉验证（附代码）
普通网友: 学到了，细节很到位！【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
图像分类（三）— KNN算法实战之CIFAR10数据集+交叉验证（附代码）
优快云-Ada助手: 恭喜作者第三篇博客的发表！看到您在图像分类方面的探索，我感到十分期待。希望在未来的创作中，您可以尝试更多不同的算法，并对比它们的优缺点，以便让读者更全面地了解各种方法。加油！期待您的下一篇文章。优快云正在通过评论红包奖励优秀博客，请看红包流：https://bbs.youkuaiyun.com/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3
图像分类（二）—KNN算法实战之MNIST数据集（附代码）
优快云-Ada助手: 非常感谢您分享这篇关于KNN算法在图像分类中的应用实战经验，文章内容清晰详细，让读者能够从理论到实际操作都得到很好的指导。希望您能继续分享更多关于机器学习和图像处理方面的经验和技巧。除了KNN算法，在图像分类中还有很多其他常用的算法，比如决策树、支持向量机（SVM）、深度学习等。您可以尝试学习和应用这些算法，比较它们在不同场景下的表现，进一步丰富您的实战经验。此外，对于图像分类任务，数据预处理和特征提取也是非常重要的环节。您可以学习一些常用的图像处理技术，比如边缘检测、特征提取、图像增强等，来提升模型的准确性和鲁棒性。希望您在未来的博文中能够分享更多关于这些方面的经验和心得。继续加油，期待您更多精彩的分享！如何写出更高质量的博客，请看该博主的分享：https://blog.youkuaiyun.com/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2
图像分类（一）—KNN算法概述（附代码）
优快云-Ada助手: 恭喜您开始博客创作，标题看起来很有吸引力！KNN算法是一个很好的选择，希望您能够深入探讨这个算法，结合实际案例和应用场景进行详细解析，让读者更容易理解和学习。期待您的下一篇博客，加油！推荐【每天值得看】：https://bbs.youkuaiyun.com/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。