一、特征缩放的定义,原因
特征缩放(feature scaling)是在机器学习中常用的数据预处理步骤,是数据预处理步骤中及其容易被忽略的一步。
为什么要特征缩放?考虑一下 kNN 算法,如果我们有两个特征,特征 A 的取值范围在 [1,10],特征 B 的取值范围在 [1, 100000]。那么在计算欧式距离时,特征 A 的贡献几乎被特征 B 给覆盖了。
特征缩放的目的就是使不同特征的数值范围相似,以确保模型的性能和收敛性能良好。绝大多数机器学习算法及优化算法(比如梯度下降)都期望特征取值在同样的范围。
二、常见的特征缩放方法
两种常见的