[机器学习] k近邻算法

最新推荐文章于 2025-09-12 17:31:31 发布

weixin_34361881

最新推荐文章于 2025-09-12 17:31:31 发布

阅读量65

点赞数

CC 4.0 BY-SA版权

文章标签：数据结构与算法人工智能 python

原文链接：http://www.cnblogs.com/Arborday/p/8420684.html

算是机器学习中最简单的算法了，顾名思义是看k个近邻的类别，测试点的类别判断为k近邻里某一类点最多的，少数服从多数，要点摘录：

1. 关键参数：k值 && 距离计算方式 && 分类决策规则

2. k=1, 即只取最近点，容易过拟合，k取较大值，容易欠拟合。k值越小，模型越复杂。k ＝ 3 or 5 works well.

3. k近邻算法的一个实现：kd树（k－k维空间，二叉树），分两步：构造kd树－－搜索kd树。复杂度O(logN). 下图是一个kd树及对应二叉树：

4. 优点：方法简单易理解, 构建模型快。缺点：对稀疏矩阵或者特征维度比较高的情况下表现不好。

参考：

a. 《Introduction to Machine Learning with Python》

b. 《统计学习方法》

c. 十五分钟理解kd树 https://www.jianshu.com/p/ffe52db3e12b

转载于:https://www.cnblogs.com/Arborday/p/8420684.html

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

weixin_34361881

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

机器学习K近邻算法——python详细代码解析（sklearn）（1）

qq_45932996的博客

10-07

1277

K个训练样本的地位是完全一样的，只要成为K个中的一个，不论这些训练样本与测试样本di之间的距离如何，都会被不加区别地对待。但是在很多情况下，用户可能会希望给予距离测试样本di更近的训练样本以更大的权重，这时候就可以在KNeighborsClassifier或KNeighborsRegressor函数中加入weights参数。weights参数用于设置近邻样本的权重，可选择为"uniform"，"distance"或自定义权重。●　"uniform"为默认选项，即所有最近邻样本权重都一样。

Python 机器学习 K-近邻算法

weixin_42098295的博客

01-30

1701

它是一种基于实例的学习（Instance-based learning），或者称为懒惰学习（Lazy learning），因为它不会从训练数据中学习一个固定的模型，而是使用整个数据集进行预测。在回归问题中，则通常是这些邻居值的平均值。选取合适的K值是至关重要的，太小的K值会使模型对噪声敏感，而太大的K值可能使模型无法捕捉到数据的特性。参数指定了计算最近邻的方法，可选项包括 'auto', 'ball_tree', 'kd_tree', 'brute'，其中'auto'会自动选择最适合数据的算法。

参与评论您还未登录，请先登录后发表或查看评论

机器学习K近邻算法

qq_41682922的博客

11-08

607

机器学习之入门级算法K近邻我们所说的KNN也就是K近邻算法！这是用来解决分类问题的：在训练集标签已经确定的情况下，给定一条新的数据，通过K近邻算法来确定它属于哪一类。 K近邻算法与逻辑回归不同的是: K近邻可以解决多分类问题，而逻辑回归是解决二分类问题的（但是工作当中逻辑回归用的还是比较多的）我之所以建议学习机器学习先学K近邻算法，是因为大多数算法需要数学方面的基础特别多，而K近邻中很少用...

机器学习算法——k-近邻算法

huangQK的博客

10-09

1617

k-近邻算法（k-Nearest Neighbour algorithm），又称为KNN算法。KNN的工作原理：给定一个已知标签类别的训练数据集，输入没有标签的新数据后，在训练数据集中找到与新数据最邻近的k个实例，如果这k个实例的多数属于某个类别，那么新数据就属于这个类别。由那些离X最近的k个点来投票决定X归为哪一类。下面我们通过一个简单的小例子来了解一下k-近邻算法：图1-1图1-1是一个很基础的knn算法模型。

机器学习之K近邻算法

青枫浦上不胜愁

09-06

1089

分类，例如，根据口味和色泽划分新的葡萄酒的类别，根据内容形式划分新上映电影的类别，根据过往人脸特征进行人脸识别等。这些问题都可以采用机器学习中非常经典的K近邻算法来解决。

机器学习（4）—— K近邻算法

jiaomongjun的博客

04-12

990

给定一个待分类（或回归）的数据点，找到训练集中距离该数据点最近的K个邻居，然后通过这些邻居的标签（分类问题）或数值（回归问题）来预测该数据点的标签或数值。：待预测样本的类别由其K个最近邻居的**多数投票（Majority Voting）**决定。”，通过计算待预测样本与训练样本的距离，找到最近的K个邻居，基于这些邻居的标签进行预测。计算待分类点与所有训练集点之间的距离，常用的距离度量包括欧几里得距离、曼哈顿距离等。：计算样本间距离的方法（如欧氏距离、曼哈顿距离）。：选择最近的K个邻居（影响模型复杂度）。

机器学习第七章之K近邻算法

wangyutao12345的博客

08-13

2055

机器学习专题课程。

机器学习——k近邻算法

unseven的博客

03-14

1043

目录算法介绍k近邻算法python代码k近邻算法归一化特征值k近邻算法优缺点算法介绍 k近邻法(k-nearest neighbors)是由Cover和Hart于1968年提出的，它是懒惰学习(lazy learning)的著名代表。 k近邻算法简单、直观：给定一个训练数据集（其中的实例类别已定），对新的输入实例，在训练数据集中找到与该实例最接近的k个实例，这k个实例的多数属于某个类，就把该输入实例分为这个类。举个栗子 1.给定了红色和蓝色的训练样本，绿色为测试样本 2.计算绿色点到其他点的距离 3.

机器学习1：k 近邻算法

weixin_60530224的博客

10-09

2304

现在给定一个测试样本 (6, 4)，使用 k 近邻算法进行分类，其中 k=5。请计算该测试样本的类别。 1) 请简述 k 近邻算法的算法步骤 2) 现在给定一个测试样本 (6, 4)，使用 k 近邻算法进行分类，其中 k=5。分别使用欧氏距离、曼哈顿距离和棋盘距离来计算测试样本与训练样本之间的距离，并观察它们对最终分类结果的影响。

【机器学习】K近邻算法

闻道有先后，术业有专攻

11-12

2455

K近邻算法（K-Nearest Neighbors, KNN）是一种简单但非常实用的监督学习算法，主要用于分类和回归问题。KNN 基于相似性度量（如欧几里得距离）来进行预测，核心思想是给定一个样本，找到与其最接近的 K 个邻居，根据这些邻居的类别或特征对该样本进行分类或预测。

机器学习K近邻算法详解：原理、实现与应用领域综述

06-21

适合人群：对机器学习有一定了解，希望深入理解K近邻算法原理及其应用的研发人员和数据科学家。使用场景及目标：①理解K近邻算法的基本原理，包括距离度量、K值选择和分类决策规则；②掌握如何使用Python和sklearn...

python机器学习K近邻算法--红酒分类预测.py

11-14

K近邻算法实战，精确的高，感兴趣的可以看一看

机器学习K近邻算法调试代码 KNN.zip

06-30

在机器学习领域，K近邻（K-Nearest Neighbors，简称KNN）算法是一种简单且直观的分类和回归方法。这个算法的核心思想是“物以类聚”，即一个样本的类别由其最近的K个邻居共同决定。在这个“KNN.zip”压缩包中，可能...

leetcode380：RandomizedSet - O(1)时间插入删除和获取随机元素（数组+哈希表的巧妙结合）

lyh2004_08的博客

09-11

736

本文介绍了如何设计一个支持O(1)时间插入、删除和获取随机元素的数据结构。关键在于巧妙结合数组和哈希表的优势：数组提供O(1)随机访问，哈希表实现O(1)查找。核心技巧是删除操作时采用"末尾替换法"，将被删除元素与数组末尾交换后删除，避免移动元素。文章详细分析了算法原理、代码实现、复杂度以及边界条件，并探讨了允许重复元素的变种问题。该方案体现了组合数据结构和空间换时间的设计思想，完美满足了题目要求的所有O(1)操作。

【算法--链表】147.对链表进行插入排序--通俗讲解

最新发布

沐怡旸的专栏

09-12

548

使用一个虚拟头节点来简化操作，维护一个已排序的链表部分，然后逐个取出未排序的节点，在已排序部分中找到合适的插入位置并插入。这就像我们打扑克牌时，一张一张地拿牌，然后把每张牌插入到手中已排序牌的正确位置

【C++】list 容器操作

C语言、数据结构、单片机、嵌入式实时操作系统、C++ 学习路径记录

09-09

465

文章摘要：本文介绍了C++中list容器的特性与应用。list作为vector的补充，解决了vector在头部/中部插入删除效率低（O(N)）和扩容代价大的问题，具有O(1)时间复杂度的插入删除优势，但牺牲了随机访问能力。文章详细讲解了list的四种迭代器（正向/反向/const/双向）、常用操作（头尾插删、任意位置操作）、排序方法（不推荐使用），以及迭代器失效问题和解决方案。最后通过对比vector和list的迭代器实现原理，解释了list采用节点指针封装实现迭代器自增操作的机制。

LeetCode 1658. 将x减到0的最小操作数

qq_57349657的博客

09-11

473

不定长滑动窗口：将x减到0的最小操作数

每日算法刷题Day67:9.9:leetcode bfs10道题，用时2h30min

2301_80044595的博客

09-09

850

2.与[[十.图论算法-基础遍历#3. 1162. 地图分析(中等,学习)]]一模一样，找每个1到各自最近的0的最短距离，即多源最短路径距离，所以将所有0入队列，向四周扩散，告诉1已经扩散的层数，即距离。所以要反过来，将所有满足条件的点当做多个源点，向外扩散，从而告诉待求点当前扩散的层数，即最短距离。，是Dijkstra算法，但因为边权只有0和1，所以用0-1BFS来优化Dijkstra，双端队列队首入0，队尾入1，保证每次队首都是边权(代价)最小的。的视频包含所有你好友的好友观看过的视频，以此类推。

【无标题】

Leeyy

09-10

695

过拟合是指模型在训练集上表现很好，但在测试集上表现较差的现象。

C++实现详解及源码解读：机器学习k近邻算法

C++实现K近邻算法（kNN算法）的知识点详解： 1. K近邻算法概念 K近邻算法（k-Nearest Neighbors, kNN）是一种基本分类与回归方法。它的核心思想是根据“物以类聚”的原理，通过一个实例点与最近邻的k个已知类别样本...