一文读懂K近邻(KNN)模型

本文深入介绍了K近邻(KNN)模型,包括算法描述、KNN的相关问题如距离度量、K值选择、不相关属性处理以及快速搜索方法(kd-tree)。讨论了距离度量对分类的影响,提出交叉验证法选择最佳K值,通过属性加权法解决维度灾难问题,并介绍了kd-tree用于加速KNN搜索。

1 算法描述

K近邻模型是个十分通俗易懂的模型,给定一个点,我们只要找到和他在空间中最近的K个点,这K个点中出现次数最多的类别,就是这个点的分类,具体算法如下:
在这里插入图片描述

如果了解其他机器学习模型朋友肯定会发现,这个模型和我们以往学到的机器学习模型有些区别,其没有决策函数也没有条件概率分布, 只有一个决策规则:
y = a r g max ⁡ c j ∑ x i ∈ N k ( x ) I ( y i = c j ) y = arg \max_{c_{j}} \sum_{x_{i} \in N_{k}(x)}I(y_{i}=c_{j}) y=argcjmaxx

评论 1
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值