K-近邻(KNN)从原理到算法的实现

K-近邻(KNN)算法是一种基于实例的学习方法,通过计算预测数据与训练样本的欧氏距离来确定相似性。该算法精度高,但计算和空间复杂度较高。基本步骤包括计算距离、排序、创建字典并进行KNN分类。在实际应用中,通过新建模块生成训练数据集和样本标签,并输入数据进行预测。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

原理介绍:首先存在一组训练样本集,而且每个样本都对应一个标签 ,即知道每一个样本所属的类别。输入预测数据,计算预测数据与每个样本的欧氏距离当作其相似性度量,然后提取前K个距离最小的数据,选择K个最相似数据中出现次数最多的分类,作为预测数据的分类,通常k是不大于20的整数。

  • 优点:精度高,对异常值不敏感
  • 缺点:计算复杂度高、空间复杂度高频

 

基本步骤如下:

  • 计算欧式距离
  • 索引排序
  • 创建字典
  • 字典排序

 

K-nearst-neighbor:

  1. 计算已知类别数据集中的点与当前点之间的距离;
  2. 按照距离升序排列;
  3. 选取与当前点距离最小的前K个点;
  4. 确定前K个点所在类别的出现频率;
  5. 返回前K个点出现频率最高的类别作为当前点的预测分类。

1、 新建名为KNN.py的模块,用来生成训练数据集和样本标签:

import numpy as np
def createDateSet():
    group = np.array([[1.0,1.1],[1.0,1.0],[0,0],[0,0.1]])
    labels = ['A','A','B','B']
    return group,labels

2、新建名为KNN-classifier模块,用于预测

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

东城青年

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值