个人理解是为了使数据集中每列数据(也就是每个特征数据)都统一标准化。即:采用Z-Score规范化数据,保证每个特征维度的数据均值为0,方差为1
注意: fit_transform 之前的数据集 train_X可以是二维的列表,也可以是pandas.DataFrame类型,fit_transform 之后的train_XX 数据类型是二维的umpy.ndarray
from sklearn.preprocessing import StandardScaler
ss = StandardScaler()
train_XX = ss.fit_transform(train_X)
参考:
https://blog.youkuaiyun.com/weixin_30271335/article/details/98907327
本文介绍如何使用Z-Score规范化方法对数据集进行预处理,确保每个特征维度的数据均值为0,方差为1,从而实现数据标准化。通过sklearn.preprocessing.StandardScaler组件,可以方便地完成这一过程。
291

被折叠的 条评论
为什么被折叠?



