1、全微分
-
当X是矩阵,dy=tr(∂y∂XTdX)dy = tr(\frac{\partial y}{\partial X}^T dX)dy=tr(∂X∂yTdX)
-
当X是向量,dy=∂y∂XTdX=tr(∂y∂XTdX)dy = \frac{\partial y}{\partial X}^T dX=tr(\frac{\partial y}{\partial X}^T dX)dy=∂X∂yTdX=tr(∂X∂yTdX)
2、活用迹(tr)
(1)a是标量,a=tr(a)(1) a是标量,a = tr(a)(1)a是标量,a=tr(a)
(2)A,B为方阵,tr(AB)=tr(BA)(2) A,B为方阵,tr(AB) = tr(BA)(2)A,B为方阵,tr(AB)=tr(BA)
(3)tr(A)=tr(AT)(3) tr(A) = tr(A^T)(3)tr(A)=tr(AT)
(4)tr(A+B)=tr(A)+tr(B)(4) tr(A+B) = tr(A)+tr(B)(4)tr(A+B)=

本文深入探讨了矩阵微分的基础概念,特别是全微分在矩阵和向量上的应用,并通过实例展示了如何利用迹(tr)特性简化矩阵导数的计算。文章详细解释了迹的性质,包括其在矩阵乘法中的交换性和对称性,以及这些性质如何帮助我们解决复杂的矩阵求导问题。
最低0.47元/天 解锁文章
985

被折叠的 条评论
为什么被折叠?



