机器学习1 - K近邻算法 + 面试题

知识复盘计划

已于 2023-11-01 13:21:05 修改

阅读量193

点赞数 1

分类专栏：机器学习文章标签：机器学习近邻算法人工智能 python

于 2023-10-03 19:01:02 首次发布

本文链接：https://blog.youkuaiyun.com/qq_45792437/article/details/133525386

版权

文章目录

一、K 近邻算法 (KNN)
二、K 近邻算法实现步骤
三、面试专题
四、参考资料

一、K 近邻算法 (KNN)

是一种非参, 监督学习的分类器 (非参是指KNN不需要假设)
可用于解决分类和回归问题
根据点与点之间的距离来捕捉相似性
- Euclidean Distance-平方差求和再开方
- Manhattan Distance-坐标差的绝对值求和
- Hamming Distance

二、K 近邻算法实现步骤

KNN算法有三个重要的考虑因素：K值的选择、距离度量方式和分类决策规则

初始化 k 的大小, k 为近邻的数量 (k-the number of neighbor)
对于在数据集上的每个样本
- 假设我们有一个数据点
- 计算每个样本跟这个数据点的距离 (列表: 索引-距离)
按距离从小到大（升序）对该列表进行排序
获取前 k个距离最大的索引
用该索引获取标签
如果回归，则返回 K 个标签的平均值
如果是分类，返回 K 个类别标签

import numpy as np
from scipy.stats import mode
# 从零实现 KNN
def predict_datapoint(pt, Xtrain, Ytrain, k)

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

知识复盘计划

关注关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

20240326-1-KNN面试题

qq_24428851的博客

04-09

667

KNN算法利用训练数据集对特征向量空间进行划分。KNN算法的核心思想是在一个含未知样本的空间，可以根据样本最近的k个样本的数据类型来确定未知样本的数据类型。。

机器学习笔记1-k近邻算法的实现

2401_84140080的博客

05-02

432

plt.show()3D图:import kNNplt.show()多图:import kNNplt.show()不熟悉的函数:add_subplot:用于指定图像的位置,例如111,指图像分成一行一列,在第一幅图上画scatter:画散点图,必须输入的有x,y坐标,可选项有颜色形状等zero:创建0矩阵归一化:处理不同取值范围的特征值时,通常需要将数值未硬化,如果将取值范围处理为0到1或者-1到1之间,下面公式可以将任意取值范围的特征值转化为0到1的区间内。

参与评论您还未登录，请先登录后发表或查看评论

K近邻（KNN）算法面试问题汇总

longshaonihaoa的博客

05-26

2953

自己救自己系列，不然要没工作了，我太难了。我只是个木得感情的搬运机器，以下内容都附有原链接地址，你不想我搬运的话，可以联系我删除好勒。红色加粗是我见了好多次，感觉经常会考得点。感觉KNN的面试问题偏少，这里列几个我网上有印象的 1、KNN原理 2、KNN优缺点 3、KNN与K-means的区别 4、欧式距离与曼哈顿距离区别答案详见这位大佬的整理https://blog.youkuaiyun.com/A_102/article/details/88948326 5、KNN三要...

KNN算法实例讲解

qq_41522951的博客

10-14

3963

KNN算法是什么？寻找最近的k个数据，推测新数据的分类算法原理通用步骤 1.计算距离 2.升序排序 3.取前K个 4.加权平均 K的选取太小：受个例影响较大，波动很大大大：导致分类模糊 K选取注意：（1）自己需要尝试不同的K，以求达到最好的效果（2）均方根误差实践题目 KNN算法预测病人是否患癌症，并输出预测的正确率！检验结果： B（良性） M（恶性）检验数据类型判断患癌症的依...

KNN算法思路以及常见面试题

yanglee0

06-02

4704

一.KNN算法概述 KNN可以说是最简单的分类算法之一，同时，它也是最常用的分类算法之一，注意KNN算法是有监督学习中的分类算法，它看起来和另一个机器学习算法Kmeans有点像（Kmeans是无监督学习算法）。关于K-means可以看上篇博客。二.KNN算法介绍 KNN的全称是K Nearest Neighbors，意思是K个最近的邻居，K的取值肯定是至关重要的。其实啊，KNN的原理就是当预测一个新的值x的时候，根据它距离最近的K个点是什么类别来判断x属于哪个类别。如下图，k=3时候，绿色x判定为蓝色。

KNN算法练习

ThinkPet

10-10

1123

# -*- coding: utf-8 -*- """ Created on Wed Oct 10 11:02:33 2018 @author: Administrator """ import pandas as pd import numpy as np import matplotlib.pyplot as plt np.random.seed(0) x=np.sort( 5*n...

机器学习+研究生复试+求职+面试题

03-30

在研究生复试或面试中，了解机器学习的基础概念和算法至关重要。以下是针对标题和描述中提及的一些关键知识点的详细解释： 1. 梯度爆炸和梯度消失：梯度爆炸是指在深度学习网络中，由于反向传播过程中激活函数导...

机器学习 -- 简析KNN（k近邻算法）

最新发布

2401_84433535的博客

05-03

123

面试前要精心做好准备，简历上写的知识点和原理都需要准备好，项目上多想想难点和亮点，这是面试时能和别人不一样的地方。还有就是表现出自己的谦虚好学，以及对于未来持续进阶的规划，企业招人更偏爱稳定的人。万事开头难，但是程序员这一条路坚持几年后发展空间还是非常大的，一切重在坚持。开源分享：【大厂前端面试题解析+核心总结学习笔记+真实项目实战+最新讲解视频】为了帮助大家更好更高效的准备面试，特别整理了《前端工程师面试手册》电子稿文件。前端面试题汇总。

面试题---机器学习算法

数据科学知识库

12-14

583

支持向量机（SVM）：适用于分类和回归问题，通过将数据映射到高维空间，并在该空间中找到一个最优的超平面来划分数据，从而实现分类或回归。决策树：适用于分类和回归问题，通过对样本数据集进行分裂来建立一棵树型结构，每个分支代表一个特征，每个叶子节点代表一个分类或回归结果。随机森林：一种基于决策树的集成学习方法，通过随机选择特征和数据集来建立多棵决策树，最终通过投票或平均值来确定分类或回归结果。K-近邻（KNN）：适用于分类和回归问题，通过找到离目标样本最近的K个样本，来预测该样本的类别或值。

李航《统计学习方法》----KNN--例题解析+ 机器学习实战

weixin_37550997的博客

01-13

4857

（文章底部有代码和数据链接）模型介绍 k近邻算法（k-nearest neighbor ,k-NN) 基本思想是：特征空间中的每个样本都可以用与它最近的K个邻居来代表。分类的过程是：k个邻居进行投票，将待预测样本归入得票最多的类别里面。模型三要素（1）k值的选择（2）距离的度量方法（3）分类决策规则常见的距离度量方式设两个n维向量 x1和x2之间的距离度量方式有： 1、曼哈顿距离...

kNN算法题.doc

08-11

编写算法计算一个任意N边型，分成k段，求K点坐标

数据挖掘十大经典算法之KNN

飞翔的小鸟

10-23

1094

邻近算法 KNN算法的决策过程　　k-Nearest Neighbor algorithm 　　右图中，绿色圆要被决定赋予哪个类，是红色三角形还是蓝色四方形？如果K=3，由于红色三角形所占比例为2/3，绿色圆将被赋予红色三角形那个类，如果K=5，由于蓝色四方形比例为3/5，因此绿色圆被赋予蓝色四方形类。　　K最近邻(k-Nearest Neighbor，K

KNN算法介绍及案例

热门推荐

m0_37940048的博客

08-24

1万+

目录一、KNN介绍K-近邻(K-Nearest Neighboor)算法定义理解K近邻总结KNN⼯作流程二、案例实现作为机器学习中最基础的算法，KNN在简单分类问题上有其独特的优势，其理念类似于中国的成语“近朱者赤，近墨者黑”，这种将特征数字转化为空间距离判断的方法也是我们认识机器学习世界的第一步。一、KNN介绍 K-近邻(K-Nearest Neighboor)算法定义如果⼀个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的⼤多数属于某⼀个类别，则该样本也属于这个类别。理解K近邻

机器学习面试题之KNN（六）

jaffe507的博客

03-27

2196

转自小狼狗的KNN面试问题的总结 1.简述一下KNN算法的原理 KNN既可以用于分类，也可以用于回归。本身没有显示的模型训练，多数情况用于分类算法。KNN算法我们主要要考虑三个重要的要素，对于固定的训练集，只要这三点确定了，算法的预测方式也就决定了。这三个最终的要素是k值的选取，距离度量的方式和分类决策规则。 1，K值的选择一般选择一个较小的值，这取决于数据量的大小和数据维度。通常K为3~10.一...

精讲精练k-近邻算法：knn（一）之KNN 相关面试题

赛博朋克

04-01

3191

1.简述一下KNN算法的原理 kNN算法称为K最近林分类算法。所谓k最近邻，就是最接近K的数据，用他们的最大特征结果来表示。改算法设计3个主要因素：分类决策规则，距离与相似的衡量，k大小。 KNN做分类预测时，一般是选择多数表决法，即训练集里和预测的样本特征最近的K个样本，预测为里面有最多类数的类别。而KNN做回归时，一般是选择平均法，即最近的K个样本的样本输出的平均值做为回归预测值。对于距离...

机器学习-KNN算法题目

J_kaiz的博客

12-15

2657

1.现有数据集“cancer_train.csv”，记录了 500 位乳腺癌问诊病人的病灶造影照片的数据，一共 30 个特征，比如“平均半径”代表病灶中心点离边界的平均距离。最后一列为标签， 1 代表阳性，说明恶性程度比较高， 0 代表阴性。请利用这份数据简单建立一个KNN模型，并评估预测结果的准确率。 # 导入KNN分类器 from sklearn.neighbors import KN...

面试算法（二）—KNN

dinkwad的博客

12-26

3330

未来面试之三：knn近邻算法

我要学R

04-21

1700

这周来个简单的算法好啦。我记得当时学的最简单的一个算法就是K近邻算法，它简单到什么程度呢？可以说它是我学过的算法中最简单的一个。但是呀，它的作用很不小嘞。初识KNN 近邻分类被称为“懒惰学习”算法。原理很简单，就是把未标记的案例归类为与他们最为相似的带有标记的案例所在的类，尽管这一想法很简单，但是紧邻分类及其强大（具体多强大我也体会不出来，反正就是既简单又强大），应用呢，离我们最近的就是预测...

机器学习之KNN（二）算法梳理总结及经典面试题实现

繁华三千东流水不舍昼夜的博客

08-12

1579

KNN算法定义有监督算法可以解决分类、回归问题算法原理物以类聚人以群分输入一个样本点，计算所有样本到该样本点的欧式距离，取前k个进行决策三个要素欧式距离判断类别远近 k值，选择方式过小受噪音影响多大收到其他样本影响超参数计算，找最优得分方式决策方式分类投票法带权投票法回归求均值带权求均值优点、缺点优点思想简单，能做分类和回...

机器学习面试指南：透彻理解题库，提升技术实力

- 模型算法：熟悉常见的机器学习算法，如线性回归、逻辑回归、决策树、随机森林、SVM、神经网络、K-近邻、聚类算法等，理解其工作原理及优缺点。 - 模型评估：了解各种评估指标，如准确率、召回率、F1分数、AUC-...