2090626——K—近邻算法

本文深入讲解K近邻(KNN)算法原理,通过实例分析展示如何根据特征空间中最近的K个样本判断未知样本的类别。探讨了K值选择对分类精度的影响及应用场景。

K近邻又称KNN算法

那什么是KNN算法
在这里插入图片描述
假如我现在在北京,可我不知道我在哪个区。
但是我知道我离其他区是什么距离。

核心算法:根据我的邻居判断我在什么位置

K——近邻算法(KNN)原理
K Nearest Neighbor 算法又叫KNN算法,这个算法是机器学习里面一个比较经典的算法,总体来说KNN算法是相对比较容易理解的算法那

定义:如果一个样本在特征空间中的K个最相似(即特征空间中最邻近)的样本中的大多数属于一个类别,则该样本也属于这个类别。

k=1 容易受到异常点的影响

如何确定谁是我的邻居
计算距离:
距离公式(欧氏距离)
在这里插入图片描述
曼哈顿距离——绝对值距离
明可夫斯基距离——

电影实例分析
在这里插入图片描述

现在有六个样本,有打斗镜头和接吻镜头是两个特征,电影类型是目标值

在这里插入图片描述
现在有一个测试样本,想要判断这个电影是动作还是爱情

在这里插入图片描述

当k =1 那么爱情片离其最近
k =2 也是这样
当k=6时? 无法确定
k=7 动作片

当我们k取值过大,容易分错,当样本不均衡的时候
k取值过小,容易受到异常点的影响。

结合前面的约会对象数据,分析k-邻近算法需要做什么样的处理

需要做无量纲化的处理
具体用标准化,比较稳定 归一化容易受到异常点的影响
在这里插入图片描述
第一个参数n_neighbors 相当于k

案列实践,鸢尾花种类预测
在这里插入图片描述

流程分析!
1)获取数据
2)从sklearn上面的数据一般都是整理好的,但是需要对数据进行测试与练习分类
3)特征工程 标准化 不需要降维(就4个特征)
4)KNN预估器流程
5)模型评估

K——近邻总结
优点: 简单,易于理解,易于实现,无需训练
缺点:懒惰算法,对测试样本分类时的计算量大,内存开销大
必须指定K值,K值选择不当则分类精度不能保证

使用场景:小数据场景,几千到几万场景, 具体场景具体业务去测试

乐播投屏是一款简单好用、功能强大的专业投屏软件,支持手机投屏电视、手机投电脑、电脑投电视等多种投屏方式。 多端兼容与跨网投屏:支持手机、平板、电脑等多种设备之间的自由组合投屏,且无需连接 WiFi,通过跨屏技术打破网络限制,扫一扫即可投屏。 广泛的应用支持:支持 10000+APP 投屏,包括综合视频、网盘与浏览器、美韩剧、斗鱼、虎牙等直播平台,还能将央视、湖南卫视等各大卫视的直播内容一键投屏。 高清流畅投屏体验:腾讯独家智能音画调校技术,支持 4K 高清画质、240Hz 超高帧率,低延迟不卡顿,能为用户提供更高清、流畅的视觉享受。 会议办公功能强大:拥有全球唯一的 “超级投屏空间”,扫码即投,无需安装。支持多人共享投屏、远程协作批注,PPT、Excel、视频等文件都能流畅展示,还具备企业级安全加密,保障会议资料不泄露。 多人互动功能:支持多人投屏,邀请好友加入投屏互动,远程也可加入。同时具备一屏多显、语音互动功能,支持多人连麦,实时语音交流。 文件支持全面:支持 PPT、PDF、Word、Excel 等办公文件,以及视频、图片等多种类型文件的投屏,还支持网盘直投,无需下载和转格式。 特色功能丰富:投屏时可同步录制投屏画面,部分版本还支持通过触控屏或电视端外接鼠标反控电脑,以及在投屏过程中用画笔实时标注等功能。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值