文章目录
环境
python 3.7
sklearn
numpy
scipy
pip3 install numpy
pip3 install scipy
pip3 install sklearn
(本文为笔记整理)
数据集
sklearn 自带一些常用的数据集帮助我们进行相关的测试。
sklearn.datasets
load_* 获取小规模数据集
fetch_* 获取大规模数据集
sklearn小数据集
sklearn.datasets.load_iris()
sklearn大数据集 sklearn.datasets.fetch_20newsgroups(data_home=None,subset=‘train’)
这里注意的是获取大数据集其实是从对应的网站下载的,data_home 是指那个对应的下载保持目录(有默认的) sub