一,特征缩放定义
特征缩放是用来标准化数据特征的范围。
二,特征缩放的作用及原理
特征缩放是针对多特征情况的。当有多个特征向量的时候,如果其中一个变化范围比较大,根据上次所说的多特征梯度下降法算法可以知道,该特征向量的参数可能会变化范围很大,从而主导整个梯度下降的过程,使得整个收敛轨迹变得复杂,让收敛的时间更长。就像下图所示:
因此,我们可以将所有特征向量的变化范围维持在一个标准化范围之中,就能减小该特征向量的影响程度,加快梯度收敛速度。
三,特征缩放的方法
例如:
这个例子中x1的变化范围就远大于x2(多特征变化范围比较中不包括x0,因为x0始终等于1),这就需要特征缩放。最简单的可以这么做:
将他们都除以取值范围,就将取值规范在一个很小的范围内了。
四,特征缩放的范围注意
特征缩放的范围如果收敛的很大或者很小,就不太适合,也就是不是一个很好的特征缩放。多