sklearn的数据集-datasets
1 sklearn 强大数据库
data sets,有很多有用的,可以用来学习算法模型的数据库。
eg: boston 房价, 糖尿病, 数字, Iris 花。
主要有两种:
- 封装好的经典数据。eg: boston 房价, 糖尿病, 数字, Iris 花。在代码中以“load”开头。
- 自己设计参数,然后生成的数据,例如用来训练线性回归模型的数据(强大)。在代码中以“make”开头
2 文档介绍
2.1 经典数据
例如,点击进入 boston 房价的数据,可以看到 sample 的总数,属性,以及 label 等信息。
2.2 构造数据
如果是自己生成数据,按照函数的形式,输入 sample,feature,target 的个数等等。
sklearn.datasets.make_regression(n_samples=100, n_features=100</