1. 归一化
- MinMaxScaler()
sclar = MinMaxScaler() #实例化
sclar = sclar.fit(data) #fit,这里生成min(x)和max(x)
result = sclar.transform(data) #通过接口导出结果
当X中特征数据量太多,fit会报错;可使用partial_fit作为训练接口
可用inverse_transform逆转归一化结果
- 利用numpy实现归一化

归一化详情
x_nor = (x - x.min(axis=0)) / (x.max(axis=0) - x.min(axis=0))
2.标准化
- StandardScaler()
sclar = StandardScaler()
sclar.fit(data)
x_td = sclar.transform(data)
transform返回标准均值为0,标准方差为1
逆转标准化与逆转归一化相同,用inverse_transform()
本文介绍了数据预处理中的两种重要方法——归一化和标准化。归一化通过MinMaxScaler进行,将数据缩放到[0,1]区间内,而标准化使用StandardScaler,使得数据服从标准正态分布,即均值为0,标准差为1。这两种方法对于不同的机器学习算法有着不同的适用性,如归一化适用于距离敏感的算法,标准化适合于基于协方差或梯度的算法。了解并正确使用这两种方法对于提升模型性能至关重要。
2356

被折叠的 条评论
为什么被折叠?



