假设函数
hypothesis是指拟合的函数,表示为 hθ(x)=θTx h θ ( x ) = θ T x , 其中 θ=[θ0,θ1,⋯,θn,] θ = [ θ 0 , θ 1 , ⋯ , θ n , ] , x=[x0,x1,⋯,xn],x0=1 x = [ x 0 , x 1 , ⋯ , x n ] , x 0 = 1
hθ(x)=[θ0θ1...θn]⎡⎣⎢⎢⎢⎢x0x1⋮xn⎤⎦⎥⎥⎥⎥=θTx h θ ( x ) = [ θ 0 θ 1 . . . θ n ] [ x 0 x 1 ⋮ x n ] = θ T x
这里需要注意的是,为了形式简洁,将 x0 x 0 放入向量中,并且赋值为1.
损失函数
定义线性回归的损失函数为:(均方误差)
对于线性回归,均方误差损失是一个凸函数,具有全局最小值。
优化方法
梯度下降法
这个比较常规
对于损失函数 J(θ) J ( θ ) , 对于每个 θj θ j ,进行更新:
repeat until converge:
θj=θj−α∂∂θjJ(θ) θ j = θ j − α ∂ ∂ θ j J ( θ )
这里需要注意的是,所有的 θj θ j 是同时更新的,也就是上式中的 θ θ 向量都采用同一个向量,直到下次更新。
对于线性回归的损失函数而言,上面的式子可以进一步写为:
θj=θj−α[1m∑mi=1(hθ(x(i))−y(i))x(i)j],(j=0,1,2,,⋯,n) θ j = θ j − α [ 1 m ∑ i = 1 m ( h θ ( x ( i ) ) − y ( i ) ) x j ( i ) ] , ( j = 0 , 1 , 2 , , ⋯ , n )