educoder 数据挖掘算法原理与实践：k-近邻

最新推荐文章于 2024-11-04 08:36:26 发布

原创

最新推荐文章于 2024-11-04 08:36:26 发布 · 2.2k 阅读

3 ·

CC 4.0 BY-SA版权

文章标签：

#数据挖掘 #算法 #近邻算法

本文深入探讨了k-近邻(knn)算法，首先介绍了knn的基本概念，接着详细阐述了如何动手实现这一算法，旨在帮助读者理解和应用knn进行数据挖掘。

第1关：knn算法概述

#encoding=utf8
import numpy as np

def topK(i,k,x,y):
    '''
    input:
        i(int):第i个样本
        k(int):最近邻样本个数
        x(ndarray):数据特征
        y(ndarray):数据标签
    output:
        topK(list):样本i的最近k个样本标签
    '''
    #*********Begin*********#
    #计算样本到所有样本的距离
    dis = np.sqrt(np.power(np.tile(x[i],(x.shape[0],1))-x,2).sum(axis=1))
    #除样本本身外的最近的k个样本的索引
    est = np