机器学习算法笔记之K近邻算法(KNeighborsClassifier)

本文介绍了sklearn库中K近邻算法的实现类KNeighborsClassifier的使用方法,包括参数设置和常见方法。通过实例展示了如何使用该算法进行分类预测,并提供了区分数字的实际案例。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

介绍:

在sklearn库中,KNeighborsClassifier是实现K近邻算法的一个类,一般都使用欧式距离进行测量。

这个类的结构如下:

sklearn.neighbors.KNeighborsClassifier

class  sklearn.neighbors. KNeighborsClassifier ( n_neighbors=5weights=’uniform’algorithm=’auto’leaf_size=30, p=2metric=’minkowski’metric_params=Nonen_jobs=1**kwargs )

在官方文档中,每个参数的含义:



n_neighbors:就是选取最近的点的个数:k

leaf_size:这个是构造树的大小,值一般选取默认值即可,太大会影响速度。

n_jobs :默认值1,选取-1占据CPU比重会减小,但运行速度也会变慢,所有的core都会运行。

这个类中的方法,在文档中的说明:


小试牛刀:

导库:
import numpy
from sklearn.neighbors import KNeighborsClassifier as kNN
构造训练集和对应的标签:
trainmat = numpy.array([[1,2,3],[2,3,5],[55,33,66],[55,33,66]])
label = numpy.array([0,0,1,1])

实例化分类器,并训练数据:
neigh = kNN(n_neighbors=3, algorithm='auto', weights='distance', n_jobs=1)
neigh.fit(trainmat,label)
训练完后会看到分类器的参数:

然后写一个测试数组:
testmat = numpy.array([2,3,4],[55,33,66])
我们使用三个最长用的方法,来看一下分类的结果:

结果很乐观,测试数组testmat中的两组值分别属于标签0和1的概率是0.99275805和1。

实战:

我们使用K近邻算法来区分数字。

这些数字是由0和1组成的txt文本文件,一个有10个数字,训练集和测试集在项目文件中提供。
github中的链接: 点击打开链接
https://github.com/smallsmallcase/KNeighborsClassifier

### 周志华《机器学习》书籍复习指南 为了有效准备期末考试,建议采用结构化的复习方法来理解周志华所著《机器学习》的核心概念。这本书籍涵盖了广泛的理论和技术细节,在复习过程中应当注重以下几个方面: #### 1. 掌握基础概念 确保对监督学习、无监督学习和支持向量机等基本术语的理解深入透彻[^1]。 #### 2. 关键算法详解 重点研究书中提到的关键算法,比如决策树、朴素贝叶斯分类器以及K近邻算法等。对于每种算法,不仅要了解其工作原理,还要熟悉如何应用这些算法解决实际问题。 #### 3. 数学推导的重要性 注意书中涉及的各种数学公式的推导过程,特别是概率论、线性代数和最优化方面的知识。这部分内容虽然可能较为抽象复杂,但对于构建坚实的理论基础至关重要。 #### 4. 实践练习不可或缺 通过编程实现一些简单的机器学习项目或实验可以帮助加深理解和记忆。尝试使用Python或其他工具包重现书本上的案例,并探索不同参数设置下模型性能的变化[^2]。 ```python from sklearn.datasets import load_iris from sklearn.model_selection import train_test_split from sklearn.neighbors import KNeighborsClassifier # 加载鸢尾花数据集 data = load_iris() X_train, X_test, y_train, y_test = train_test_split(data.data, data.target) # 创建并训练kNN分类器 clf = KNeighborsClassifier(n_neighbors=3).fit(X_train, y_train) print(f'Accuracy on test set: {clf.score(X_test, y_test):.2f}') ```
评论 8
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值