Sklearn 机器学习数值标准化

Thomas Kant

于 2025-07-24 21:00:00 发布

阅读量1.5k

点赞数 35

CC 4.0 BY-SA版权

分类专栏：人工智能文章标签：机器学习 sklearn 人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/Java_1710/article/details/149600457

💖亲爱的技术爱好者们，热烈欢迎来到 Kant2048 的博客！我是 Thomas Kant，很开心能在优快云上与你们相遇～💖

在这里插入图片描述

本博客的精华专栏：
【自动化测试】【测试经验】【人工智能】【Python】

在这里插入图片描述

Sklearn 机器学习：数值标准化实战指南（含 CSV 读取与训练测试处理）

在机器学习中，特征的数值标准化（Normalization/Standardization） 是模型训练前非常重要的预处理步骤，尤其在使用如 SVM、KNN、逻辑回归等对特征尺度敏感的算法时更是关键。

💡 术语说明：在实际使用中，Normalization 和 Standardization 虽常被混用，但两者含义略有不同：

Standardization 指将数据转换为标准正态分布（均值为0，标准差为1）；

Normalization 通常指将数据缩放到特定区间（如 [0,1]）；

本文统一使用“数值标准化”泛指特征尺度调整的所有方法，具体方法将在文中分别说明。

📌 一、什么是数值标准化？

数值标准化是将特征数据缩放到统一的尺度上，常见方法包括：

Z-score 标准化（StandardScaler）
将每一维特征转换为均值为 0，标准差为 1 的分布：

$\frac{x - \mu}{\sigma}$

其中 $\mu$ 为特征均值，$\sigma$ 为标准差。
最小-最大缩放（MinMaxScaler）
将特征压缩到指定区间（如 [0, 1]）：

$\frac{x - x_{\min}}{x_{\max} - x_{\min}}$

最低0.47元/天解锁文章

200万优质内容无限畅学

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

Thomas Kant 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。