version:sklearn0.16.1
sklearn.preprocessing模块包括scaling, centering, normalization 和imputation方法。
包括
- data.py 处理数据(均值,方差等)
- label.py 二值化
- _weight.py
- imputation.py 缺失值处理
1.data.py
1._mean_and_std(X, axis=0, with_mean=True, with_std=True):
计算均值和标准差,标准差为0的话则置为1
2.scale(X, axis=0, with_mean=True, with_std=True, copy=True)
公式为:(X-mean)/std 计算时对每个属性/每列分别进行。
将数据按期属性(按列进行)减去其均值,并处以其方差。得到的结果是,对于每个属性/每列来说所有数据都聚集在0附近,方差为1。
scale函数不能用来处理稀疏矩阵
3.class MinMaxScaler()
使特征标准化
本文介绍了sklearn.preprocessing模块的功能,包括数据缩放、中心化、规范化及缺失值处理等方法。重点讲解了scale函数的使用及其计算公式,并提到了MinMaxScaler类用于特征标准化。
768

被折叠的 条评论
为什么被折叠?



