关于KNN算法的基础及其底层代码实现

本文介绍了K近邻算法的基本概念,包括其工作原理、步骤,以及常用的几种距离计算方法。通过实例演示如何使用欧几里得距离法处理电影数据,预测未知样本的类别。

算法核心

对于一个样本来说,选择K个离其最近的样本。这k个样本都有自己的类别,在这k个之中,哪个种类最多,则该样本属于哪一类别。

(一般k自己取一个较小的值)

算法实现流程(以下我们将样本简称为点):

首先:计算数据集中已知类的点与我们选择要识别的点的距离。

然后:按距离以递增的次序排列。

紧接:自己定一个k值,然后选取与要识别的点的距离最小的k个点。

其次:统计k个点中,各个类别出现的概率。

最后:取概率最高的类别作为要识别的点的类别。

(样本的维度:一般而言样本的维度其实就是其特征的多少)

准备工作:

如何计算距离:

补充知识点(以下为我们常用的知识点):

(x,y皆为样本,或者说是样本的特征向量,特征的值相减的时候是对应的)

欧几里得距离:d(x,y)=\sqrt{\sum_{i}^{}(x_{i}-y_{i})_{}^{2}}
曼哈顿距离:
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值