数据挖掘之归一化

在阅读数据模型的文章中,经常看到针对特征维度进行归一化处理。

归一化的定义:

一种简化计算的方式,将有量纲的表达式,经过变换,化为无量纲的表达式,成为纯量,避免具有不同物理意义和量纲的输入变量不能平等使用。在统计学中,归一化的具体作用是归纳统一样本的统计分布性。归一化在0-1之间是统计的概率分布,归一化在-1--+1之间是统计的坐标分布。


归一化处理后,神经网络算法可以较好的收敛。


常见的归一化的函数如下

1,线性函数转换,表达式如下:

  y=(x-MinValue)/(MaxValue-MinValue)  

说明:x、y分别为转换前、后的值,MaxValue、MinValue分别为样本的最大值和最小值。

 

2,对数函数转换,表达式如下

y=log10(x)  说明:以10为底的对数函数转换。


3、反正切函数转换,表达式如下

  y=atan(x)*2/PI


归一化的具体方法根据你的样本特征,需要选择恰当的方法。

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值