python学习日志 10.9
sk-learn估计器
sklearn中进行特征工程时,大部分方法都是继承自转换器(transformer),需要先生成一个转换器实例,再调用fit_transform方法。
常见的监督学习算法则是继承自估计器类(estimator),所以在化身调包侠的时候,需要先生成一个estimator实例,在调用fit方法进行学习生成模型。predict方法则是用生成的模型对测试集进行估计。
KNN算法
一种分类算法,定义是如果一个样本在特征空间中的k个最相似(即最邻近)的样本大多属于某一类,则这个样本属于某一类。
即将某一个样本划归到它最邻近样本的种类当中。
调用KNN算法:
from sklearn.neighbors import KNeighborsClassifier
其中,KNeighborsClassifier支持一个n_neighbors参数来确定算法的k取值。
在生成一个estimator实例后,可以通过estimator.fit(x_train,y_train)来对训练集进行训练。在此之前,我们应该完成特征提取、降维、标准化等工作。
完成学习后,可以调用estimator.predict方法来对测试集的数据进行估计,或者使用estimator.score来计算测试集的正确率。
本文探讨了sklearn库中特征工程的基本概念,包括转换器的使用及常见监督学习算法的流程。详细介绍了KNN算法原理,以及如何在sklearn中实现KNN分类,包括参数设置、模型训练和预测。
219

被折叠的 条评论
为什么被折叠?



