归一化: 1、把数变为(0,1)之间的小数 主要是为了数据处理方便提出来的,把数据映射到0~1范围之内处理,更加便捷快速。 2、把有量纲表达式变为无量纲表达式 归一化是一种简化计算的方式,即将有量纲的表达式,经过变换,化为无量纲的表达式,成为纯量。 好处: 1)归一化后加快了梯度下降求最优解的速度; 2)归一化有可能提高精度(如KNN) 标准化: 数据的标准化是将数据按比例缩放,使之落入一个小的特定区间。由于信用指标体系的各个指标度量单位是不同的,为了能够将指标参与评价计算,需要对指标进行规范化处理,通过函数变换将其数值映射到某个数值区间。 好处: 1)使得不同度量之间的特征具有可比性,对目标函数的影响体现在几何分布上,而不是数值上 2) 不改变原始数据的分布