标准化和归一化

  1. 归一化(0-1 normalization/ min-max normalization)
    把数变为(0,1)之间的小数,特征数据范围不同归一化后方便统一处理
    这种方法有一个缺陷就是当有新数据加入时,可能导致max和min的变化,需要重新定义

  2. z-score 标准化(zero-mean normalization)
    经过处理的数据符合标准正态分布,z-score标准化方法适用于属性A的最大值和最小值未知的情况,或有超出取值范围的离群数据的情况。
    该种标准化方式要求原始数据的分布可以近似为高斯分布,否则效果会变得很糟糕。

在不涉及距离度量、协方差计算、数据不符合正太分布的时候,可以使用归一化方法。比如图像处理中,将RGB图像转换为灰度图像后将其值限定在[0 255]的范围。因为其协方差产生了倍数值的缩放,因此这种方式无法消除量纲对方差、协方差的影响,对PCA分析影响巨大;同时,由于量纲的存在,使用不同的量纲、距离的计算结果会不同。而在第二种归一化方式中,新的数据由于对方差进行了归一化,这时候每个维度的量纲其实已经等价了,每个维度都服从均值为0、方差1的正态分布,在计算距离的时候,每个维度都是去量纲化的,避免了不同量纲的选取对距离计算产生的巨大影响。

详情可以参考:link

标准化(Standardization)归一化(Normalization)是两种常见的数据预处理方法,旨在将特征数据转换为具有某种标准尺度的格式,以帮助模型更有效地学习[^3]。 ### 概念 - **标准化**:标准化是一种将数据转换为均值为 0,标准差为 1 的标准正态分布的方法。它通过减去数据的均值并除以标准差来实现。 - **归一化**:归一化通常是将数据缩放到 [0, 1] 或 [-1, 1] 的区间内。常见的归一化方法有最小 - 最大归一化,它通过将数据减去最小值并除以最大值与最小值的差来实现。 ### 作用 在数据预处理中,选择合适的标准化归一化方法对提升模型性能至关重要。标准化适用于数据分布近似正态分布的情况,而归一化更适合数据分布没有明显规律的情况。在实际应用中,应根据数据的具体情况使用的机器学习算法来选择合适的预处理方法[^4]。 ### 方法 #### 标准化 常见的标准化方法是 Z - score 标准化,公式为:$z = \frac{x - \mu}{\sigma}$,其中 $x$ 是原始数据,$\mu$ 是数据的均值,$\sigma$ 是数据的标准差。 以下是使用 Python 的 `sklearn` 库实现 Z - score 标准化的示例代码: ```python from sklearn.preprocessing import StandardScaler import numpy as np # 示例数据 data = np.array([[1, 2], [3, 4], [5, 6]]) scaler = StandardScaler() scaled_data = scaler.fit_transform(data) print(scaled_data) ``` #### 归一化 最小 - 最大归一化是常见的归一化方法,公式为:$x_{norm} = \frac{x - x_{min}}{x_{max} - x_{min}}$,其中 $x$ 是原始数据,$x_{min}$ 是数据的最小值,$x_{max}$ 是数据的最大值。 以下是使用 Python 的 `sklearn` 库实现最小 - 最大归一化的示例代码: ```python from sklearn.preprocessing import MinMaxScaler import numpy as np # 示例数据 data = np.array([[1, 2], [3, 4], [5, 6]]) scaler = MinMaxScaler() scaled_data = scaler.fit_transform(data) print(scaled_data) ``` ### 应用 在深度学习、机器学习等领域,标准化归一化都有广泛的应用。例如在神经网络中,标准化归一化可以加速模型的收敛速度,提高模型的稳定性泛化能力。在数据可视化中,对数据进行标准化归一化可以使不同特征的数据在同一尺度下进行比较。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值