9、机器学习中的K近邻与朴素贝叶斯方法

最新推荐文章于 2025-12-03 17:31:48 发布

stem5

最新推荐文章于 2025-12-03 17:31:48 发布

阅读量25

点赞数

CC 4.0 BY-SA版权

分类专栏：机器学习方法精讲文章标签：机器学习 K近邻朴素贝叶斯

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/stem5/article/details/151459932

机器学习方法精讲专栏收录该内容

76 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

机器学习中的K近邻与朴素贝叶斯方法

1 K近邻（k-NN）方法

1.1 k-NN概述

k-NN是一种重要且简单的分类和回归方法。其基本做法是，对于给定的训练实例点和输入实例点，先确定输入实例的k个最近训练实例点，然后利用这k个训练实例的多数类别来预测输入实例的类别。

k-NN模型对应基于训练数据集对特征空间的划分。当训练集、距离度量、k值和分类决策规则确定时，k-NN的结果是唯一确定的。k-NN的三个要素为距离度量、k值的选择和分类决策规则。常用的距离度量有欧几里得距离和更一般的Lp距离。k值较小时，k-NN模型更复杂；k值较大时，模型更简单。k值的选择反映了近似误差和估计误差之间的权衡，通常通过交叉验证选择最优的k值。常用的分类决策规则是多数投票，对应经验风险最小化。

1.2 k-NN的kd树实现

在实现k-NN时，主要关注的是如何在训练数据上进行快速的k-NN搜索，特别是当特征空间维度和训练数据量较大时，这一点尤为重要。

1.2.1 线性扫描方法

最简单的k-NN实现方法是线性扫描，即计算输入实例与每个训练实例之间的距离。但当训练集较大时，这种计算非常耗时，不可行。

1.2.2 kd树方法

为提高k-NN搜索的效率，可以考虑使用特殊结构来存储训练数据并减少距离计算，其中kd树方法就是一种。

1.2.2.1 构建kd树

kd树是一种用于存储k维空间中实例点的树状数据结构，用于快速检索。它是一棵表示k维空间划分的二叉树，构建kd树相当于用垂直于坐标轴的超平面不断分割k维空间，形成一系列k维超矩形区域，每

会员秒杀 ¥9.9 重磅福利

超级会员免费看

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符 | 博主筛选后可见

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。