梯度下降法的多变量线性回归
理论概述
-
线性回归方程
单变量线性回归只包含一个变量xxx,其线性回归方程可表示为h(θ)=θ0+θ1x1h(\theta)=\theta_0+\theta_1x_1h(θ)=θ0+θ1x1。
当模型包含多个变量时,线性回归方程:h(θ)=θ0+θ1x1+⋯+θnxnh(\theta)=\theta_0+\theta_1x_1+\dots+\theta_nx_nh(θ)=θ0+θ1x1+⋯+θnxn,可假设x0=1x_0=1x0=1,此时方程可表示成h(θ)=θ0x0+θ1x1+⋯+θnxn=∑i=0i=nθixih(\theta)=\theta_0x_0+\theta_1x_1+\dots+\theta_nx_n=\sum_{i=0}^{i=n} \theta_ix_ih(θ)=θ0x0+θ1x1+⋯+θnxn=∑i=0i=nθixi。
-
目标(代价)函数
-
批量梯度下降(BGD):每一次迭代时使用所有样本来进行梯度的更新
J(θ0,θ1,…,θn)=12m∑i=1i=m(hθ(x(i))−y(i))2J(\theta_0,\theta_1,\dots,\theta_n)=\frac{1}{2m}\sum_{i=1}^{i=m}(h_\theta(x^{(i)})-y^{(i)})^2J(θ0,θ1,…,θn)=2m1∑i=1i=m(hθ(x(i))−y(i))2
-
目标函数对θi\theta_iθi求偏导
∂J(θ0,θ1,…,θn)∂θj=1m∑i=1i=m(hθ(x(i))−y(i))xj(i)\frac{\partial J(\theta_0,\theta_1,\dots,\theta_n)}{\partial\theta_j}=\frac{1}{m}\sum_{i=1}^{i=m}(h_\theta(x^{(i)})-y^{(i)})x_j^{(i)}∂θj∂J(θ0,θ1,…,θn)</
-