机器学习笔记 - 何时进行特征缩放

本文介绍了特征缩放的概念,包括最小-最大归一化和标准差归一化等方法。讨论了何时选择归一化或标准化,以及它们对机器学习算法如梯度下降、距离度量、PCA、回归和基于树的算法的影响。通过葡萄酒数据集展示了特征缩放的实际应用效果。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

一、什么是特征缩放

        特征缩放是一种用于标准化自变量或数据特征范围的方法。在数据处理中,也称为数据归一化,通常在数据预处理步骤中执行。

        举个例子——如果你有多个独立变量,比如年龄、薪水和身高;它们的范围分别为(18-100 年)、(25,000-75,000 欧元)和(1-2 米),特征缩放将帮助它们都处于同一范围内,例如以 0 为中心或在范围内(0,1) 取决于缩放技术。

        为了将上述内容可视化,让我们以 存放在 UCI 机器学习存储库中的“葡萄酒数据集”中的葡萄酒数据集中的酒精和苹果酸含量的自变量为例 。您可以在下面看到两种最常见的缩放技术(标准化和标准化)对数据集的影响。

标准化和规范化对 Wine 数据集的影响

二、缩放方法

1、Min-Max Normalization

     &

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

坐望云起

如果觉得有用,请不吝打赏

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值