Sklearn 学习（一）

最新推荐文章于 2024-04-16 15:16:46 发布

原创

最新推荐文章于 2024-04-16 15:16:46 发布 · 522 阅读

3 ·

CC 4.0 BY-SA版权

文章标签：

#python #机器学习

本文是关于Scikit learn（Sklearn）的初步介绍，包括其在机器学习中的应用，如分类、回归和聚类。文章详细讲解了Sklearn的通用学习模式，包括导入模块、创建数据、训练模型和预测。还探讨了Sklearn的数据集，如iris和boston，并展示了如何使用线性回归模型进行训练和预测。最后，提到了模型的属性，如coef_和intercept_，用于理解模型的内部工作原理。

Scikit learn介绍

Scikit learn 简称sklearn，是机器学习领域最知名的python模块之一。

Sklearn 包含了很多种机器学习的方式:

Classification 分类
Regression 回归
Clustering 非监督分类
Dimensionality reduction 数据降维
Model Selection 模型选择
Preprocessing 数据预处理

Sklearn 通用学习模式

1、导入模块

from sklearn import datasets #导入数据集
from sklearn.model_selection import train_test_split #导入模式选择（随机划分训练集和数据集）
from sklearn.neighbors import KNeighborsClassifier #导入机器学习方法（KNN）

2、创建数据

加载 iris 的数据，把属性存在 X，类别标签存在 y：
iris = datasets.load_iris()
iris_x= iris.data
iris_y = iris.target
将数据集随机分为训练集和测试集，其中 test_size=0.3，即测试集占总数据的 30%：
x_train, X_test, y_train, y_test = train_test_split( iris_x, iris_y, test_size=0.3)