机器学习特征缩放

网上流传的关于特征取值范围不同的一个损失函数等高线图如下,J(\theta )为损失函数.

这个 损失函数来源于一个房价预测的案例:

房价预测函数为:

h_{\theta }=\theta _{0}+\theta _{1}x_{1}+\theta _{2}x_{2}

那么以均方误差MSE构建损失函数:

J(\theta )=\frac{1}{2m}\sum _{i=1}^{m}(h_{\theta }(x^{i})-y^{i})^{2}

由于x{_{1}}的取值范围远大于x{_{2}}, 因此对于同样的损失函数变化,即从一条等高线变化到另一条等高线,\theta _{1}\theta _{2}的变化要小得多,也就是说等高线从横向来看,要比纵向来看密的多,最终的形状就会如上图所示是细长型。

通过梯度下降进行参数更新:

\theta {_{j}}:=\theta {_{j}}-\alpha \frac{1}{m}\sum _{i=1}^{m}(h_{\theta}(x^{i})-y^{i})x_{j}^{(i)}

由于x_{1}远大于x_{2}, 因此,每次更新时\theta _{1}的更新幅度要大于\theta _{2}, 也就是参数向量\vec{\theta}的更新方向要更贴近\theta _{1}坐标轴方向。

因此,参数更新的路径就会像图中所示那样曲折前进,因而收敛速度很慢。

如果通过特征缩放,使每个维度的取值范围差不多,那就不会这么曲折前进了,而是步步直接逼近最优解。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值