Python中Numpy数组的归一化处理

本文介绍了一种使用Python和Numpy库实现数据预处理的方法——(0,1)归一化。该方法能有效解决特征值范围不同导致的学习结果偏差问题。文章提供了具体的代码实现细节。
部署运行你感兴趣的模型镜像

背景介绍

在对机器学习的数据进行预处理时,往往都需要归一化,从而避免因特征值范围不同而造成学习结果偏差。本节给出Python中将Numpy数组实现(0,1)归一化的代码,其它种类的归一化再遇到时再进行补充。

所谓(0,1)归一化,就是通过遍历feature vector里的每一个特征值的数据,将Max和Min的记录下来,并通过Max-Min作为基数(即Min=0,Max=1)进行数据的归一化处理。

详细代码

假设一个Numpy数组中每行都为一个样本,每列为一个特征,且只包含数据,没有包含标签,则在归一化时,只需将每列的最大和最小值取出来,然后用每个样本的特征值减去该特征值的最小值然后除以最大与最小特征值的差即可。

def maxminnorm(array):
    maxcols=array.max(axis=0)
    mincols=array.min(axis=0)
    data_shape = array.shape
    data_rows = data_shape[0]
    data_cols = data_shape[1]
    t=np.empty((data_rows,data_cols))
    for i in xrange(data_cols):
        t[:,i]=(array[:,i]-mincols[i])/(maxcols[i]-mincols[i])
    return t


您可能感兴趣的与本文相关的镜像

Python3.9

Python3.9

Conda
Python

Python 是一种高级、解释型、通用的编程语言,以其简洁易读的语法而闻名,适用于广泛的应用,包括Web开发、数据分析、人工智能和自动化脚本

评论 4
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

汀桦坞

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值