24、数据预处理：归一化、标准化及其他变换方法

seed

于 2025-07-18 15:02:55 发布

阅读量31

点赞数

CC 4.0 BY-SA版权

分类专栏：深度学习的视觉之旅文章标签：数据预处理归一化标准化

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/seed/article/details/151036939

深度学习的视觉之旅专栏收录该内容

68 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

数据预处理：归一化、标准化及其他变换方法

在数据处理和机器学习中，数据的预处理是至关重要的一步。不同特征的数据范围可能差异很大，而较大的数值可能会对学习程序产生更大的影响。为了使所有数据大致具有可比性，我们通常会对数据进行一些变换操作。

1. 归一化（Normalization）

归一化是数据变换中常见的第一步。在统计学意义上，当我们将数据缩放到某个特定范围时，就称数据被归一化了。最常用的归一化范围是 [-1,1] 和 [0,1] ，具体选择取决于数据及其含义。例如，谈论负数的苹果数量或年龄是没有意义的，所以对于这类数据， [0,1] 可能是更合适的范围。

大多数机器学习库都提供了归一化的函数，但我们需要记得调用它。以一个由 232 个点组成的吉他形状的二维数据集为例，假设这些点代表某些测量结果，如人的年龄和体重，或者歌曲的节奏和音量，我们将其两个特征分别记为 x 和 y 。

当我们将吉他形状数据的每个特征归一化到 [-1,1] 范围时， x 值从 -1 到 1 进行缩放， y 值也独立地从 -1 到 1 进行缩放。但最终得到的吉他形状会有一点扭曲，这是因为 y 轴方向的拉伸程度比 x 轴更大。这是由于原始数据的不同维度跨越的范围不同，在这个例子中

会员秒杀 ¥9.9 重磅福利

超级会员免费看

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。