Python -- Sklearn：MinMaxScaler（将数据预处理为(0,1)上的数）

最新推荐文章于 2025-10-11 11:54:07 发布

原创最新推荐文章于 2025-10-11 11:54:07 发布 · 1.1w 阅读

22 ·

CC 4.0 BY-SA版权

文章标签：

#python #机器学习

数据分析同时被 2 个专栏收录

18 篇文章

订阅专栏

机器学习

10 篇文章

订阅专栏

本文介绍了两种数据尺度转换方法：自定义处理和使用MinMaxScaler库。自定义方法通过计算数据的最小值和最大值，将数据缩放至(0,1)区间，然后可以反向转换回原始范围。而MinMaxScaler是sklearn库中的预处理工具，同样将数据缩放到0到1之间，提供了一步到位的fit_transform方法，并能方便地将缩放后的数据还原。这两种方法对于数据标准化和机器学习模型的训练至关重要。

方法一：自定义处理

# 将数据scale为(0,1)间数据
scaled_df = (df - df.min()) / (df.max()-df.min())   
# 将(0,1)间数据scale回原来的范围
scaled_df * (df.max() - df.min()) + df.min()

方法二：MinMaxscaler

from sklearn.preprocessing import MinMaxScaler
scaler = MinMaxScaler(feature_range=(0, 1))
scaler.fit( df )                          #找出每列最大、小值，并存储
scaled_df = scaler.transform( df )        #将df进行转化到(0,1)间
scaler.data_max_                          #查看最大值
scaler.data_min_                          #查看最小值
# scaled_df = scaler.fit_transform( df )   将fit,transform一步到位
scaler.inverse_transform( scaled_df )     #将数据返回到原来的范围