目录
1.2 sklearn库的datasets模块集成了部分数据分析的经典数据集,常用数据集的加载函数和解释如下:
1.4.sklearn除了提供基本的特征变换函数外,还提供了降维算法(如PCA)、特征选择算法,这些算法的使用也是通过转换器的方式进行的。
参看《python数据分析与应用》
scikit-learn和tensorflow的区别:https://www.jianshu.com/p/0837b7c6ce10
Scikit-learn使用总结,不错的总结:https://www.jianshu.com/p/516f009c0875
1.使用sklearn转换器处理数据
scikit-learn简称sklean整合了多种机器学习算法,使用方便。
1.1 sklearn提供的模块:
model_selection(模型选择模块)、preprocessing (数据预处理模块)、decompisition (特征分解模块),通过这3个模块能够实现数据的预处理与模型构建前的数据标准化、二值化、数据集的分割、交叉验证和PCA降维等工作。
1.2 sklearn库的datasets模块集成了部分数据分析的经典数据集,常用数据集的加载函数和解释如下:
https://blog.youkuaiyun.com/weixin_41571493/article/details/82709345
|
数据集名称 |
调用方式 |
适用算法 |
数据规模 |
---|---|---|---|---|
小数据集 |
波士顿房价数据集 |
load_boston() |
回归 |
506*13 |
鸢尾花数据集 |
load_iris() |
分类 |
150*4 |
|
糖尿病数据集 |
load_diabetes() |
回归 |
442*10 |
|
乳腺癌数据集 |
load-breast-cancer() |
分类、聚类 |
569*30 |
|
|
|
|
|
|
大数据集 |
手写数字数据集 |
load_digits() |
分类 |
5620*64 |
Olivetti脸部图像数据集 |
fetch_olivetti_facecs |
降维 |
400*64*64 |
|