方法一:自定义处理
# 将数据scale为(0,1)间数据
scaled_df = (df - df.min()) / (df.max()-df.min())
# 将(0,1)间数据scale回原来的范围
scaled_df * (df.max() - df.min()) + df.min()
方法二:MinMaxscaler
from sklearn.preprocessing import MinMaxScaler
scaler = MinMaxScaler(feature_range=(0, 1))
scaler.fit( df ) #找出每列最大、小值,并存储
scaled_df = scaler.transform( df ) #将df进行转化到(0,1)间
scaler.data_max_ #查看最大值
scaler.data_min_ #查看最小值
# scaled_df = scaler.fit_transform( df ) 将fit,transform一步到位
scaler.inverse_transform( scaled_df ) #将数据返回到原来的范围

本文介绍了两种数据尺度转换方法:自定义处理和使用MinMaxScaler库。自定义方法通过计算数据的最小值和最大值,将数据缩放至(0,1)区间,然后可以反向转换回原始范围。而MinMaxScaler是sklearn库中的预处理工具,同样将数据缩放到0到1之间,提供了一步到位的fit_transform方法,并能方便地将缩放后的数据还原。这两种方法对于数据标准化和机器学习模型的训练至关重要。
1530

被折叠的 条评论
为什么被折叠?



