多特征线性回归

有多个特征的线性回归就是我们常说的多变量线性回归。我们先申明一些数学标记的含义:

x(i)j代表第i个样本中第j个特征
x(i)代表第i个样本的所有特征
m代表训练样本个数
n代表特征个数

模型的多变量形式如下:

hθ(x)=θ0+θ1x1+θ2x2++θnxn

为了便于理解,我们可以抽象一种情形,θ0代表房屋的基本价格,θ1代表每平米的价格,θ2代表每层的价格,x1代表房屋面积,x2代表房屋层数。

通过矩阵乘法,多项式可以写成矩阵的形式:

hθ(x)=[θ0θ1θ2θn]x0x1x2xn=θTx

成本函数(代价函数)可以写作:

J(θ0,θ1,,θn)=12mi=1m(hθ(x(i))y(i))2

对单个θj进行梯度下降有:

θjθj:=θjαθjJ(θ):=θjα1mi=1m(hθ(x(i))y(i))x(i)j

实用技巧——特征缩放(feature scaling)
动机:保证特征在相似的范围内
特征范围差异大会极大减缓收敛速度,梯度下降的迭代过程中会出现震荡现象。
例如:
x1表示房屋面积(0-2000)平方米
x2表示卧室数量(1-5)

x1x2=size(feet2)2000=number of bedroom5

如果我们想把特征范围控制在[-1, 1]之间,可以进行以下变化:

xi:=xiμisi

其中μi是特征i的均值,si是特征的范围值(max - min)。

学习率选择
如果学习率太小,梯度下降会收敛的很慢;
如果学习率太大,每次迭代J(θ)反而会增大,导致无法收敛。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值