KNN

最新推荐文章于 2025-08-10 22:38:56 发布

小本拉

最新推荐文章于 2025-08-10 22:38:56 发布

阅读量127

点赞数 2

CC 4.0 BY-SA版权

文章标签：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/weixin_43038150/article/details/97896826

KNN算法(K-近邻算法)
k-NN算法采用测量不同特征值之间的距离方法进行分类
优点：简单直观、精度高、对异常值不敏感
缺点：计算复杂、空间复杂度高

输入样本： $T=\left \{x_{1},x_{2}, x_{3},... \right \}$ 对数据进行归一化处理，然后根据某种距离度量方式得到输入样本 $T$ 与训练集中的每个样本的距离，找出与输入样本距离最近的k个点(样本),记作 $N_{k}$ 。
在 $N_{k}$ 中根据某种分类规则(多数表决规则)决定输入样本 $T$ 的类别 $y$
距离度量方式：

欧式距离：优点是当作标轴进行正交旋转后，欧氏距离保持不变。 $d=\sqrt{(x_{i}^{1}-x_{j}^{1})^{2}+(x_{i}^{2}-x_{j}^{2})^{2}+...}$
曼哈顿距离： $d=\left | x_{i}^{1}-x_{j}^{1} \right |+\left | x_{i}^{2}-x_{j}^{2} \right |+\left | ... \right |$
切比雪夫距离 $d=max(\left | x_{i}^{1}-x_{j}^{1} \right |,\left | x_{i}^{2}-x_{j}^{2} \right |,\left | ... \right |)$
归一化\标准化方法：
Min-Max 归一化： $X=(\frac{x-X_{min}}{X_{max}-X_{min}})$
Z-Score 标准化: $X=\frac{x-X_{mean}}{\sigma }$
均值标准化： $X=\frac{x-X_{mean}}{X_{max}-X_{min}}$
归一化是为了在计算的时候消除量纲对计算的影响。
标准化在进行特征缩放的同时还不会改变数据的原始分布。
关于归一化与标准化的详细介绍

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。