一、背景
归一化(Normalization)和标准化(Standardization)是数据预处理中的两种常见技术,旨在调整数据的范围和分布,以提高机器学习模型或者深度学习模型的性能和训练速度。虽然它们的目标相似,但具体方法和应用场景有所不同。
1、归一化
归一化是将数据缩放到一个特定的范围(通常是0到1之间),以确保不同特征具有相同的尺度。归一化常用于需要保持数据相对比例的场景,如图像处理和神经网络训练。最常见的归一化方法是最小-最大归一化(Min-Max Normalization),其公式为:
其中:
- x是原始数据。
- x′是归一化后的数据。
和
分别是数据集中的最小值和最大值。
2、标准化
标准化是将数据转换为均值为0、标准差为1的标准正态分布