sklearn库中数据预处理函数fit_transform()和transform()的区别--01

最新推荐文章于 2025-11-05 18:43:02 发布

原创最新推荐文章于 2025-11-05 18:43:02 发布 · 1.3w 阅读

37 ·

CC 4.0 BY-SA版权

文章标签：

#python #机器学习

sklearn 专栏收录该内容

5 篇文章

订阅专栏

本文详细解释了在Python机器学习中StandardScaler的fit_transform与transform函数的区别。通过实例说明了如何使用这两个函数进行数据标准化，并解释了为何在测试集上只使用transform。

部署运行你感兴趣的模型镜像

# coding=utf-8

from sklearn import preprocessing
import numpy as np
from sklearn.preprocessing import StandardScaler

'''
    StandardScaler 类   
        预处理对象
        
        fit() 预处理的数据，计算矩阵列均值和列标准差
        transform（data） 得到标准化的矩阵  ,用此方法，必须使用fit先进行预处理计算均值和标准差
            然后用fit计算的均值和标准差，进行标准化处理  {x_i - u}/标准差
        fit_transform(data) 相当于是fit和transform的组合
'''

data = np.array([[0., 0.],
                 [0., 0.],
                 [1., 1.],
                 [1., 1.]])


scaler = StandardScaler()

print(scaler.fit(data))

print('-----------')
print(scaler.mean_)
print(np.std(data,axis=0))
print('-----------')

print(scaler.transform(data))

print(scaler.fit_transform(data))

原文链接:https://blog.youkuaiyun.com/quiet_girl/article/details/72517053

敲《Python机器学习及实践》上的code的时候，对于数据预处理中涉及到的fit_transform()函数和transform()函数之间的区别很模糊，查阅了很多资料，这里整理一下：

涉及到这两个函数的代码如下：

[python] view plain copy