归一化是一种简化计算的方式,即将有量纲的表达式,经过变换,化为无量纲的表达式,成为纯量。 在多种计算中都经常用到这种方法。
据特征值进行分类的时候,如果所有变量位于同一值域范围内,利用这些变量一次性算出距离值是有意义的。
比如在统计房与CPI、GDP等关系时,需要进行归一化处理。
在统计学中,归一化的具体作用是归纳统一样本的统计分布性。归一化在0-1之间是统计的概率分布,归一化在-1--+1之间是统计的坐标分布。 即该函数在(-∞,+∞)的积分为1 例如概率中的密度函数就满足归一化条件
1、线性函数转换,表达式如下:
y=(x-MinValue)/(MaxValue-MinValue) 说明:x、y分别为转换前、后的值,MaxValue、MinValue分别为样本的最大值和最小值。2、对数函数转换,表达式如下
y=log10(x) 说明:以10为底的对数函数转换。3、反正切函数转换,表达式如下
y=atan(x)*2/PI
4、减去均值,乘以方差:
y=(x-means)/ variance
参见:
http://baike.baidu.com/view/829823.htm
http://www.cnblogs.com/XiaoS/archive/2011/01/22/1942001.html
本文介绍了归一化的基本概念及其在统计学中的应用。通过不同类型的归一化函数,如线性函数、对数函数等,将原始数据转换到特定区间内,便于比较和分析。

被折叠的 条评论
为什么被折叠?



