文章目录
前言
一、Sklearn工具包
1 sklearn.preprocessing 预处理工具包
(1)标准化:StandardScaler类
- sklearn 里面preprocessing(预处理模块),StandardScaler()可以将数据进行标准化,即转换为均值为0,方差为1的正态分布
- 注意StandardScaler()只支持列标准化,即每一列都减去均值,然后除以方差,好像是不支持行标准化
- .fit_transform(data): 进行标准化
- .inverse_transform(data):返回标准化
可以将经过标准化的特征数据转换回其原始形式。StandardScaler 在标准化数据时,会存储每个特征(每列)的均值和标准差,因此可以用来逆转标准化过程。你可以使用 inverse_transform 方法来实现这一点:
from sklearn.preprocessing import StandardScaler
import numpy as np
# 示例数据,shape 是 (样本数, 特征数)
features = np.array([[1, 2, 3],
[4, 5, 6],
[7,