sklearn库
sklearn 是 scikit — learn 的简称,是一个基于 Python 的第三方模块。 sklearn 库集成了一些常用的机器学习方法,在进行机器学习任务时,并不需要实现算法,只需要简单的调用 sklearn 库中提供的模块就能完成大多数的机器学习任务。
sklearn 库是在 Numpy 、 Scipy 和 matplotlib 的基础上开发而成的,因此在介绍 sklearn 的安装前,需要先安装这些依赖库。
Sklearn 内置数据集
鸢尾花(iris)数据集
#导入鸢尾花数据集
from sklearn.datasets import load_iris
iris=load_iris()
结果:
应用
#转为数据框
import pandas as pd
iris_df=pd.DataFrame(iris.data,columns=iris