对测试数据集的归一化

注:测试数据集用的方差与均值应是训练数据集的方差与均值。
scikit-learn中的Scaler
import numpy as np
from sklearn import datasets
from sklearn.model_selection import train_test_split
iris = datasets.load_iris()
X = iris.data
y = iris.target
X_train, X_test, y_train, y_test = train_test_split(iris.data, iris.target, test_size = 0.2, random_state = 666)
scikit-learn中的StandardScaler
from sklearn.preprocessing

本文介绍了如何使用scikit-learn的StandardScaler进行数据预处理,强调了在归一化过程中应使用训练数据集的统计信息。通过创建自定义的StandardScaler类,展示了如何计算均值和标准差,并应用到测试数据集上,确保数据的标准化处理。
最低0.47元/天 解锁文章
750

被折叠的 条评论
为什么被折叠?



