Sklearn 机器学习 数值标准化

💖亲爱的技术爱好者们,热烈欢迎来到 Kant2048 的博客!我是 Thomas Kant,很开心能在优快云上与你们相遇~💖

在这里插入图片描述

本博客的精华专栏:
【自动化测试】 【测试经验】 【人工智能】 【Python】


在这里插入图片描述

Sklearn 机器学习:数值标准化实战指南(含 CSV 读取与训练测试处理)

在机器学习中,特征的数值标准化(Normalization/Standardization) 是模型训练前非常重要的预处理步骤,尤其在使用如 SVM、KNN、逻辑回归等对特征尺度敏感的算法时更是关键。

💡 术语说明:在实际使用中,NormalizationStandardization 虽常被混用,但两者含义略有不同:

  • Standardization 指将数据转换为标准正态分布(均值为0,标准差为1);
  • Normalization 通常指将数据缩放到特定区间(如 [0,1]);

本文统一使用“数值标准化”泛指特征尺度调整的所有方法,具体方法将在文中分别说明。


📌 一、什么是数值标准化?

数值标准化是将特征数据缩放到统一的尺度上,常见方法包括:

  • Z-score 标准化(StandardScaler)
    将每一维特征转换为均值为 0,标准差为 1 的分布:

    z = x − μ σ z = \frac{x - \mu}{\sigma} z=σxμ

    其中 $\mu$ 为特征均值,$\sigma$ 为标准差。

  • 最小-最大缩放(MinMaxScaler)
    将特征压缩到指定区间(如 [0, 1]):

    x ′ = x − x min ⁡ x max ⁡ − x min ⁡ x' = \frac{x - x_{\min}}{x_{\max} - x_{\min}} x

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Thomas Kant

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值