机器学习正规方程(Normal Equation)推导

本文介绍如何利用正规方程求解使得代价函数最小化的参数θ=(XTX)−1XTy。通过矩阵求导的方式,推导出θ的具体公式,并提供了另一种变形推导的方法。文中还附上了矩阵求导的常用公式。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

利用正规方程求解出使得代价函数最小的参数 θ = ( X T X ) − 1 X T y \theta=(X^TX)^{-1}X^Ty θ=(XTX)1XTy
有两种推导方法

1.矩阵求导

已知代价函数为:
J ( θ ) = 1 2 ( X θ − y ) 2 = 1 2 ( X θ − y ) T ( X θ − y ) = 1 2 ( θ T X T − y T ) ( X θ − y ) = 1 2 ( θ T X T X θ − θ T X T y − X θ y T + y T y ) \begin{aligned} J(\theta)&=\frac{1}{2}(X\theta-y)^2\\ &=\frac{1}{2}(X\theta-y)^T(X\theta-y)\\ &=\frac{1}{2}(\theta^TX^T-y^T)(X\theta-y)\\ &=\frac{1}{2}(\theta^TX^TX\theta-\theta^TX^Ty-X\theta y^T+y^Ty) \end{aligned} J(θ)=21(Xθy)2=21(Xθy)T(Xθy)=21(θTXTyT)(Xθy)=21(θTXTXθθTXTyXθyT+yTy)
主要用到的矩阵求导公式:
∂ ( A B ) ∂ B = A T ∂ ( A B T ) ∂ B = A ∂ ( X T A B ) ∂ B = 2 A X \frac{\partial (AB)}{\partial B}=A^T\\ \frac{\partial (AB^T)}{\partial B}=A\\ \frac{\partial (X^TAB)}{\partial B}=2AX B(AB)=ATB(ABT)=AB(XTAB)=2AX
使 J ( θ ) J(\theta) J(θ) θ \theta θ求导等于0
则有:
∂ J ( θ ) ∂ θ = 1 2 ( ∂ ∂ θ ( θ T X T X θ ) − ∂ ∂ θ ( θ T X T y ) − ∂ ∂ θ ( y T X θ ) + ∂ ∂ θ ( y T y ) ) = 1 2 ( 2 X T X θ − X T y − X T y ) = X T X θ − X T y = 0 \begin{aligned} \frac{\partial J(\theta)}{\partial\theta}&=\frac{1}{2}\left(\frac{\partial}{\partial\theta}(\theta^TX^TX\theta)-\frac{\partial}{\partial\theta}(\theta^TX^Ty)-\frac{\partial}{\partial\theta}(y^TX\theta)+\frac{\partial}{\partial\theta}(y^Ty)\right)\\ &=\frac{1}{2}(2X^TX\theta-X^Ty-X^Ty)\\ &=X^TX\theta-X^Ty\\ &=0 \end{aligned} θJ(θ)=21(θ(θTXTXθ)θ(θTXTy)θ(yTXθ)+θ(yTy))=21(2XTXθXTyXTy)=XTXθXTy=0

X T X θ − X T y = 0 X T X θ = X T y X^TX\theta-X^Ty=0\\ X^TX\theta=X^Ty XTXθXTy=0XTXθ=XTy
两侧乘以 ( X T X ) − 1 (X^TX)^{-1} (XTX)1便得出 θ = ( X T X ) − 1 X T y \theta=(X^TX)^{-1}X^Ty θ=(XTX)1XTy

更多矩阵公式参见Matrix Cookbook,非常全面的一本参考手册:
http://www2.imm.dtu.dk/pubdb/edoc/imm3274.pdf

2.变形

见另一篇文章Normal equation公式推导

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值