KNN算法

本文深入解析KNN算法,一种用于分类和回归的非线性算法。重点介绍了K值选择、距离计算、超参数分析及标准化处理,对于理解KNN算法的工作原理和优化策略具有重要指导意义。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >


介绍

       K 最邻近算法是分类算法,也可用于回归问题。它根据距离最近的 K 个点的类别,判断未分类点的类别。也就是说,一个点的类别由距离其最近的 K 个点中占比最大的类别决定。其中,K 是超参数。KNN是一种非线性分类器

距离

       用欧式距离定义。

超参数

       与参数相区别。参数是通过学习得到的变量,超参数是预设的变量。

分析过程

K 值的选择

       KNN 的决策边界一般不是线性的,所以说 KNN 是一种非线性分类器。
       K 越小,决策边界越不平滑,模型复杂度越高;K 越大,决策边界越平滑,模型复杂度越低,易欠拟合。
       K 值的选择过程就是调参的过程,常用 N 折交叉验证。K 最好选奇数。

标准化

       使各特征有同等的地位。常用的方法有极差法消除量级标准差标准化



参考链接:
https://zhuanlan.zhihu.com/p/79531731

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值