机器学习第一周打卡:knn算法学习

本文深入解析KNN算法的原理及应用,包括距离度量、K值选择与分类决策规则。阐述了算法流程,如距离计算、排序、K值确定及分类结果预测。同时讨论了算法优缺点,如简单直观但可能受数据分布影响,并提出高维数据降维的解决方案。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

用途:用来做分类或者做逻辑回归用
模型是由三个核心元素构成:
1、距离度量
2、K值
3、分类决策规则

整体算法流程:
1、计算测试集到训练集的各个数据点的距离,这里就可以用很多距离进行考核
2、对距离进行排序
3、选择K值,这个K值,是指距离测试集最近的训练集要选多少个
4、看选择K值后的几个训练值频次是怎么样的,然后把测试集的结果=频次最高的那个结果就完事儿了

其实挺简单,可以理解为:找距离我最近的几个样本,他们中大部分的样子就是我的样子
在这里插入图片描述
回答上面问题哈:
1、优点:简单已理解,可以给业务迅速讲清楚
缺点:如果测试集数据在训练集范围外部,就不好进行预测
2、在这里插入图片描述
可能存在距离相等,但是位置对称的情况,这样就选错范围了
3、如何选取K值
多测几遍,看预测值与真实值的误差,最终选取最小误差情况下的k值
4、时间复杂度o(n),高维数据进行降维。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值