迹求导原因
矩阵求导最终都是华为标量求导,迹就是最简单的衡量标量 一定要掌握
总结
T r ( A B ) = T r ( B A ) Tr(AB) =Tr(BA) Tr(AB)=Tr(BA)
T r ( A B C ) = T r ( B C A ) = T r ( C A B ) Tr(ABC) = Tr(BCA) = Tr(CAB) Tr(ABC)=Tr(BCA)=Tr(CAB)
T r ( A ) = T r ( A ′ ) Tr(A) = Tr(A') Tr(A)=Tr(A′)
d ( T r ( X B ) ) = d ( T r ( B X ) ) = B ′ d(Tr(XB))=d(Tr(BX)) = B' d(Tr(XB))=d(Tr(BX))=B′
X作为自变量(矩阵),若
d ( T r ( X ′ B ) ) = d ( T r ( B ′ X ) = B d(Tr(X'B)) = d(Tr(B'X)=B d(Tr(X′B))=d(Tr(B′X)=B
d T r ( A ′ X B ′ ) = d T r ( B X ′ A ) = d T r ( X ′ A B ) = A B dTr(A'XB')=dTr(BX'A)=dTr(X'AB)=AB dTr(A′

本文详细介绍了矩阵求导的基本概念,特别是矩阵迹(Trace)的性质及其在求导过程中的作用。矩阵迹是衡量标量的重要方式,其在乘法中具有交换性,并且在求导时遵循特定规则。例如,对于Tr(AB),其偏导数与B'相关。同时,展示了二次项如Tr(AXBX')的求导技巧,揭示了矩阵乘法和求导之间的内在联系。这些知识点对于理解和应用矩阵微分至关重要。
最低0.47元/天 解锁文章
757





