问题: 对于ℓ(W)=f(W)=∥ln(XW⊙D)∥F2\ell(W)=f(W)=\|\ln (XW \odot D) \|_{F}^{2}ℓ(W)=f(W)=∥ln(XW⊙D)∥F2, 其导数是多少呢?
1、解法一
大佬直接帮忙给了计算步骤。从结果上看,矩阵的运算维度这些是对的。

但是第2行怎么来的我没有看懂。于是又请教大佬了,给出了计算的核心是:
用fro范数的定义:∥X∥F2=tr(XTX),得到d∥X∥F2=2tr(XTdX)。我漏写个系数2。用fro范数的定义:\|X\|_F^2 = tr(X^T X),得到d\|X\|_F^2 = 2tr(X^T dX)。我漏写个系数2。用fro范数的定义:∥X∥F2=tr(XTX),得到d∥X∥F2=2tr(XTdX)。我漏写个系数2。
我试着推算了下,但是没有完全推出来:
d∥X∥F2=dtr(XTX)=tr[d(XTX)]=tr[d(XT)X+XTdX]=tr[d(XT)X]+tr[XTdX]=tr[Xd(XT)]+tr[XTdX] \begin{align} \begin{split} d\|X\|_F^{2} & =d tr(X^T X) \\ & = tr [d(X^T X)] \\ & = tr [d(X^T) X + X^TdX] \\ & = tr [d(X^T) X] + tr[X^TdX] \\ & = tr [Xd(X^T) ] + tr[X^TdX] \\ \end{split} \end{align} d∥X∥F2=dtr(XTX)=tr[d(XTX)]=tr[d(XT)X+XTdX]=tr[d(XT)X]+tr[XTdX]=tr[Xd(XT)]+tr[XTdX]
对比大佬的结果是 2tr(XTdX)2tr(X^T dX)2tr(XTdX), 则我的推算中应该存在如下等式:
tr[XdXT]=tr(XTdX) \begin{align} \begin{split} tr [XdX^T ] =tr(X^T dX) \end{split} \end{align} tr[XdXT]=tr(X

最低0.47元/天 解锁文章
8万+

被折叠的 条评论
为什么被折叠?



