python 数据归一化方法

本文介绍了Python中两种数据归一化方法:1. max-min标准化,将数据范围映射到0到1之间;2. z-score标准化,使数据符合均值为0,标准差为1的标准正态分布。这两种方法常用于深度学习预处理步骤。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

normalization methord

1. max-min标准化

通过这种方法将数据映射到(0,1)之间

def Max_MinNormalization(data,Max,Min):
    data = (data - Min) / (Max - Min)
    return data

其中,数据的最大值和最小值可以通过np.max()np.min()获取.

2. z

Python中,数据归一化是一种常见的预处理步骤,用于将数值特征缩放到特定的范围内,比如01或-11之间。常用的归一化函数有以下几种: 1. **MinMaxScaler** (from sklearn.preprocessing): 这是最简单的归一化方法,它通过减去最小值然后除以最大值来调整数据。例如: ```python from sklearn.preprocessing import MinMaxScaler scaler = MinMaxScaler() scaled_data = scaler.fit_transform(data) ``` 2. **StandardScaler** (同样来自sklearn.preprocessing): 这种方法标准化数据,使得均值0,标准差为1。公式通常是`(x - mean) / std_dev`。示例: ```python from sklearn.preprocessing import StandardScaler scaler = StandardScaler() scaled_data = scaler.fit_transform(data) ``` 3. **RobustScaler** 或 **QuantileTransformer**: 对于异常值敏感的数据,可以使用 RobustScaler,它使用四分位数范围;而QuantileTransformer则是基于百分位数进行转换。 4. **Normalizer** (from sklearn.preprocessing): 如果你想对向量长度进行归一化,使其模长为1,可以使用Normalizer。例如: ```python from sklearn.preprocessing import Normalizer normalizer = Normalizer(norm='l2') normalized_data = normalizer.transform(data) ``` 每个函数适用于不同的场景,你需要根据数据的具体特性选择合适的归一化方法。在使用之前,记得先分割数据集为训练集和测试集,因为归一化是在训练集上进行的,测试集则应用相同的转换规则。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值