1、为什么要归一化
引入归一化,是由于不同的特征之间,其量纲或者量纲单位往往不同,变化区间也处于不同的数量级,若不进行归一化,可能导致某些指标被忽略,影响到数据分析的结果。
例如影响房价的两个特征,面积和房间数量,面积有80,90,100等,房间数有1,2,3等,你看,这两个指标度量方式根本不在一个数量级上。
为了消除特征之间的量纲影响,需要进行归一化处理,以解决特征指标之间的可比性,原始数据,经归一化处理后,各个指标处于同一种数量级,可以直接对比评价。
2、归一化的本质
归一化:xi−xminxmax−xmin归一化:\frac{x_i - x_{min}}{x_{max} - x_{min}}归一化:xmax−xminxi−xmin
标准化:xi−uσ标准化:\frac{x_i - u}{\sigma}标准化:σxi−u
归一化和标准化本质是一种线性变化,线性变化有很多良好的性质,例如,不改变原始数据的排序;不改变数值a和数值b之差的相对值。这些性质,使得数据处理之后,更有助于分析。
3、归一化和标准化的区别
归一化是”缩放“,将数据”拍扁“统一到区间。
标准化一般是指把均值调整成0,方差调整成1。
为什么要归一化
最新推荐文章于 2025-03-26 07:45:04 发布