ML 常用 矩阵求导

这篇博客介绍了机器学习中矩阵求导的基本规则,包括矩阵加法、乘法的求导,逆矩阵的求导,以及涉及到偏导数与转置、乘积、迹和行列式的互动关系。这些是深度学习模型优化时必不可少的数学工具。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

矩阵常用求导,遵循分母布局,越前面的式子越经常见到

( A + B ) T = A T + B T (A+B)^{T} = A^{T}+B^{T} (A+B)T=AT+BT

( A B ) T = B T A T (AB)^{T} = B^{T}A^{T} (AB)T=BTAT

( A B ) − 1 = B − 1 A − 1 (AB)^{-1} = B^{-1}A^{-1} (AB)1=B1A1

∂ b T X ∂ X = b \frac{\partial b^{T}X}{\partial X} = b XbTX=b

∂ X T X ∂ X = 2 X \frac{\partial X^{T}X}{\partial X} = 2X XXTX=2X

∂ X T B X ∂ X = ( B + B T ) X \frac{\partial X^{T}BX}{\partial X} = (B+B^{T})X XXTBX=(B+BT)X

∂ X T b ∂ X = ∂ b T X ∂ X = b \frac{\partial X^{T}b}{\partial X} = \frac{\partial b^{T}X}{\partial X} = b XXTb=XbTX=b

∂ a T X b ∂ X = a b T \frac{\partial a^{T}Xb}{\partial X} = ab^{T} XaTXb=abT

∂ a T X T b ∂ X = b a T \frac{\partial a^{T}X^{T}b}{\partial X} = ba^{T} XaTXTb=baT

∂ a T X a ∂ X = ∂ a T X T a ∂ X = a a T \frac{\partial a^{T}Xa}{\partial X} = \frac{\partial a^{T}X^{T}a}{\partial X} = aa^{T} XaTXa=XaTXTa=aaT

∂ b T X T X c ∂ X = X ( b c T + c b T ) \frac{\partial b^{T}X^{T}Xc}{\partial X} = X(bc^{T}+cb^{T}) XbTXTXc=X(bcT+cbT)

T r ( A ) = ∑ i A i i = ∑ i λ i Tr(A) = \sum_{i} A_{ii} = \sum_{i} \lambda_{i} Tr(A)=iAii=iλi

∂ t r ( A B ) ∂ A = B T \frac{\partial tr(AB)}{\partial A} = B^{T} Atr(AB)=BT

∂ ∣ A ∣ ∂ A = ∣ A ∣ A − 1 \frac{\partial |A|}{\partial A} = |A|A^{-1} AA=AA1

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值