大数据分析中,数据处理之数据归一化

本文详细介绍数据归一化的概念及重要性,旨在使数据处理更便捷高效。文章重点介绍了三种常见归一化方法:线性转换、对数函数转换和0均值标准化(Z-score方法),并提供了具体算法公式,帮助读者理解如何将原始数据映射到0~1范围内,以消除量纲和数量级影响。

数据处理之数据归一化

为了方便数据处理,通常将数据映射到0~1范围之内,可以使处理过程更加便捷、快速。把有量纲表达式变换为无量纲表达式,成为纯量。该方法实现对原始数据的等比例缩放。通过利用变量取值的最大值和最小值(或者最大值)将原始数据转换为界于某一特定范围的数据,从而消除量纲和数量级影响,改变变量在分析中的权重来解决不同度量的问题。
主要算法有:线性转换、对数函数转换、0 均值标准化(Z-score方法)
下面介绍三大算法的主要公式!!

三大归一化数据处理算法

线性转换

线性比例变换,计算公式如下:
在这里插入图片描述
此处x*表示处理之后的数据,x表示原始数据(下同)

对数函数转换

在这里插入图片描述
上式中,max 表示样本数据中的最大值。

0 均值标准化(Z-score方法)

在这里插入图片描述
上式中,xi表示样本数据,mean(x)表示样本数据平均值,σ表示样本数据的标准差。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值