《统计学习方法》笔记三 k近邻法

最新推荐文章于 2025-09-10 15:24:29 发布

转载最新推荐文章于 2025-09-10 15:24:29 发布 · 112 阅读

0 ·

CC 4.0 BY-SA版权

原文链接：http://www.cnblogs.com/wwf828/p/9769440.html

文章标签：

#数据结构与算法

本文详细介绍了k近邻算法的基本原理，包括k值选择、距离度量和分类决策规则。探讨了不同距离度量对最近邻点的影响，并讨论了k值大小对模型复杂度和过拟合的影响。同时，介绍了k近邻法的实现方法——kd树。

本系列笔记内容参考来源为李航《统计学习方法》

k近邻是一种基本分类与回归方法，书中只讨论分类情况。输入为实例的特征向量，输出为实例的类别。k值的选择、距离度量及分类决策规则是k近邻法的三个基本要素。

k近邻算法

给定一个训练数据集，对新的输入实例，在训练数据集中找到与该实例最邻近的k个实例，这k个实例的多数属于某个类，就把该输入实例分为这个类。

k近邻法没有显示的学习过程。

k近邻模型

距离度量

一般为欧式距离，Lp距离、Minkowski距离等

由不同的距离度量所确定的最近邻点是不同的。

式3.5也称为切比雪夫距离。

夹角余弦

几何中用来衡量两个向量方向的相似度。

k值的选择

k值小时，k近邻模型更复杂，容易发生过拟合；k值大时，模型更简单。k值的选择反映了对近似误差与估计误差之间的权衡，通常由交叉验证选择最优的k。

分类决策规则

常用的分类决策规则是多数表决，对应与经验风险最小化。

k近邻法的实现：kd树

构造kd树算法如下：

搜索kd树即回溯法：

转载于:https://www.cnblogs.com/wwf828/p/9769440.html

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

weixin_30552811

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

【统计学习方法】学习笔记——第三章：K近邻法

小哲的博客

02-09

936

统计学习方法学习笔记——K近邻法1. k近邻算法2. k近邻模型2.1模型2.2距离度量2.3 k值的选择2.4 分类决策规则3. 估计误差与近似误差3.1 估计误差3.2 近似误差3.3 两者区别与联系4. k近邻法的实现：kd树4.1 构造kd树参考资料 kkk近邻法（k-nearest neighbor, k-NN）是一种基本分类与回归方法。这里只讨论分类问题中的k近邻法。k近邻法的输入为实例的特征向量，对应于特征空间中点；输出为实例的类别，可以取多类。k近邻法假设给定一个训练数据集，其中的实例类别已

第三章 K近邻法（k-nearest neighbor）

xiaozi-ML的专栏

03-21

883

1、K近邻法（k-nearest neighbor）：是一种基本分类与回归方法。输入：为实例的特征向量，对应于特征空间的点；输出：为实例的类别，可以取多类。基本思想：假设给定一个训练数据集，其中的实例类别已定。分类时，对新的实例，根据其k个最近邻的训练实例的类别，通过多数表决等方式进行预测。因此，k最近邻法不具有显式的

参与评论您还未登录，请先登录后发表或查看评论

李航《统计学习方法》笔记之k近邻法

timerring的博客

07-31

1750

K近邻思想物以类聚K近邻没有显式的训练过程（新样本与原来样本计算距离度量）距离度量(1)欧式距离两点之间直线(2)曼哈顿距离城市街区距(3)切比雪夫距离棋盘距离分类决策规则多数表决httpshttpshttps。......

【统计学习方法】K-近邻法

JIANGSAS的博客

03-07

1549

K-近邻法学习笔记及代码实现

统计学习方法读书笔记（三）-k近邻法

scu-liu的博客

01-16

327

全部笔记的汇总贴：统计学习方法读书笔记汇总贴一、kkk近邻算法给定一个训练数据集，对新的输入实例，在训练数据集中找到与该实例最邻近的kkk个实例，这kkk个实例的多数属于某个类，就把该输入实例分为这个类。kkk近邻法没有显式的学习过程。 k近邻法的特殊情况是k=1k=1k=1的情形，称为最近邻算法。对于输入的实例点（特征向量）xxx，最近邻法将训练数据集中与xxx最邻近点的类作为xxx的类。二、kkk近邻模型模型由三个基本要素一一距离度量、kkk值的选择和分类决策规则决定。（一）模型 kkk近

统计学习方法笔记（二）：k近邻法

hnbxs的博客

02-13

1686

k 近邻法的输入为实例的特征向量，对应于特征空间的点；输出为实例的类别，可以取多类． k 近邻法假设给定一个训练数据集，其中的实例类别已定．分类时，对新的实例，根据其 k 个最近邻的训练实例的类别，通过多数表决等方式进行预测。

统计学习方法读书笔记第三章：k近邻法

weixin_40692963的博客

02-13

299

统计学习方法读书笔记第三章：k近邻法k近邻法k紧邻算法k近邻模型k近邻法的实现：kd树 k近邻法 kkk近邻法是一种基本分类与回归方法。kkk近邻的输入为实例的特征向量，对应于特征空间的点；输出为实例的类别，可以取多类。kkk近邻法假设给定一个训练数据集，其中的实例类别已定。分类时，对新的实例，根据其kkk个最近邻的训练实例的类别，通过多数表决等方式进行预测。因此，kkk近邻法不具有显式的学习过程...

统计学习方法 | K 近邻法

happylls666的博客

12-19

329

K 近邻法学习笔记

统计学习方法-K近邻法-读书笔记

qq_38829768的博客

11-08

298

1、前言 K近邻法是一种基本分类与回归方法。K近邻法是根据其K个最近邻的训练实例的类别，通过多数表决等方式进行预测，k值得选择，距离度量，分类决策规则是K近邻法得三个基本要素，K=1时，称为最近邻算法。 2、模型当训练集，距离度量，k值以及分类决策规则确定后，特征空间已经根据这些要素被划分为一些子空间，且子空间里每个点所属得类也被确定。 3、策略 3.1 距离特征空间中两个实例点的距离是相似程...

统计学习方法笔记-k近邻

机器笨猫

12-25

388

统计学习方法-k近邻 k近邻方法是一种惰性学习算法，可以用于回归和分类，它的主要思想是投票机制，对于一个测试实例xjx_jxj, 我们在有标签的训练数据集上找到和最相近的k个数据，用他们的label进行投票，分类问题则进行表决投票，回归问题使用加权平均或者直接平均的方法。算法和模型由于这个模型很容易理解，我们直接给出kNN分类模型其算法伪代码: 输入:训练数据 T={(x1,y1),(...

二叉树的前中后序遍历(迭代法)

mrjieke6的博客

09-07

1293

本文系统介绍了二叉树前序、中序和后序遍历的迭代实现方法。前序遍历采用栈结构，按;根→右→左 ;顺序入栈；中序遍历先全部左子树入栈再访问节点；后序遍历则通过修改前序遍历顺序为"根→右→左 ;后反转结果。三种遍历时间复杂度均为O(n)，空间复杂度最坏O(n)。与递归实现相比，迭代方法避免了栈溢出风险，处理大型树更稳定。每种遍历方式都配有详细代码解析、执行示例和复杂度分析，并讨论了实际应用场景，为掌握树结构操作提供了系统指导。

每日算法刷题Day67:9.9:leetcode bfs10道题，用时2h30min

2301_80044595的博客

09-09

569

2.与[[十.图论算法-基础遍历#3. 1162. 地图分析(中等,学习)]]一模一样，找每个1到各自最近的0的最短距离，即多源最短路径距离，所以将所有0入队列，向四周扩散，告诉1已经扩散的层数，即距离。所以要反过来，将所有满足条件的点当做多个源点，向外扩散，从而告诉待求点当前扩散的层数，即最短距离。，是Dijkstra算法，但因为边权只有0和1，所以用0-1BFS来优化Dijkstra，双端队列队首入0，队尾入1，保证每次队首都是边权(代价)最小的。的视频包含所有你好友的好友观看过的视频，以此类推。

【无标题】

最新发布

Leeyy

09-10

622

过拟合是指模型在训练集上表现很好，但在测试集上表现较差的现象。

【牛客刷题-剑指Offer】BM18 二维数组中的查找：一题四解，从暴力到最优

字节卷动

09-06

188

方法时间复杂度空间复杂度优点缺点适用场景暴力遍历On×mOn×mO1O(1)O1简单直接，易实现效率低，不适合大数据量小规模数据二分查找Omlog⁡nOmlognO1O(1)O1利用行有序，效率较高未利用列有序特性行数较少时Z字形查找OnmO(n + m)OnmO1O(1)O1最优解，利用行列有序无各种规模数据递归分治平均优于OnmO(nm)OnmOlog⁡nmOlognm。

C语言深度入门系列：第八篇 - 结构体、联合体与枚举：程序世界的复合数据类型大师

而世之奇伟、瑰怪，非常之观，常在于险远，而人之所罕至焉，故非有志者不能至也！

09-10

440

复合数据类型是C语言程序设计的高级特性，掌握了它们，您就能够构建出复杂而高效的数据结构，为实现大型程序打下坚实基础。这些概念在后续学习数据结构、算法以及系统编程时将发挥重要作用。

【动态规划：简单多状态dp问题】删除并获得点数 && 粉刷房子

lirendada的博客

09-07

1035

文章摘要本文介绍了两个动态规划问题：删除并获得点数和粉刷房子。对于前者，通过将原数组映射到有序连续数组转化为类似打家劫舍的问题，利用状态转移方程求解最大点数。后者则通过定义三种颜色状态，使用二维数组记录每个房子涂不同颜色的最小花费，确保相邻房子颜色不同。两个问题均通过动态规划高效解决，展示了如何将复杂问题转化为经典模型进行处理。代码实现中，前者采用预处理和状态转移，后者利用虚拟位置保证初始化正确性，最终返回最小值作为结果。

【内存管理】__merge_or_add_vmap_area 函数解析

u010971180的博客

09-09

879

本文深入解析了Linux内核中的__merge_or_add_vmap_area函数及其关键调用kmem_cache_free(vmap_area_cachep, va)。该函数负责将释放的虚拟地址区域插入全局管理结构并尝试合并相邻空闲块以减少内存碎片，通过红黑树和链表维护地址区间的有序性。kmem_cache_free调用则用于释放合并后不再需要的vmap_area结构体内存。文章详细剖析了函数参数、核心逻辑、错误处理机制及典型应用场景，重点强调了合并顺序的严格性和内存管理的高效性。该机制广泛应用在vma

C++设计模式，高级开发，算法原理实战，系统设计与实战（视频教程）

闲余知道

09-10

585

C++设计模式，高级开发，算法原理实战，系统设计与实战（视频教程）

K近邻算法详解：K值选择与距离度量

"这篇学习笔记主要探讨了统计学习方法中的K近邻算法，包括其基本原理、距离度量、K值选择以及与近似误差和估计误差的关系。" K近邻算法（K-Nearest Neighbors，简称KNN）是机器学习领域中一种简单而强大的非参数...