KNN算法

最新推荐文章于 2020-10-09 14:47:44 发布

原创最新推荐文章于 2020-10-09 14:47:44 发布 · 1.1k 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

机器学习专栏收录该内容

7 篇文章

订阅专栏

本文深入解析KNN算法，一种用于分类和回归的非线性算法。重点介绍了K值选择、距离计算、超参数分析及标准化处理，对于理解KNN算法的工作原理和优化策略具有重要指导意义。

KNN算法

介绍
- 距离
- 超参数
分析过程
- K 值的选择
- 标准化

介绍

K 最邻近算法是分类算法，也可用于回归问题。它根据距离最近的 K 个点的类别，判断未分类点的类别。也就是说，一个点的类别由距离其最近的 K 个点中占比最大的类别决定。其中，K 是超参数。KNN是一种非线性分类器。

距离

用欧式距离定义。

超参数

与参数相区别。参数是通过学习得到的变量，超参数是预设的变量。

分析过程

K 值的选择

KNN 的决策边界一般不是线性的，所以说 KNN 是一种非线性分类器。
K 越小，决策边界越不平滑，模型复杂度越高；K 越大，决策边界越平滑，模型复杂度越低，易欠拟合。
K 值的选择过程就是调参的过程，常用 N 折交叉验证。K 最好选奇数。

标准化

使各特征有同等的地位。常用的方法有极差法消除量级和标准差标准化。

参考链接：
https://zhuanlan.zhihu.com/p/79531731

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。