一个F范数对矩阵求导例子【2】

问题: 对于ℓ(W)=f(W)=∥ln⁡(XW⊙D)∥F2\ell(W)=f(W)=\|\ln (XW \odot D) \|_{F}^{2}(W)=f(W)=ln(XWD)F2, 其导数是多少呢?


1、解法一

大佬直接帮忙给了计算步骤。从结果上看,矩阵的运算维度这些是对的。
在这里插入图片描述
但是第2行怎么来的我没有看懂。于是又请教大佬了,给出了计算的核心是:

用fro范数的定义:∥X∥F2=tr(XTX),得到d∥X∥F2=2tr(XTdX)。我漏写个系数2。用fro范数的定义:\|X\|_F^2 = tr(X^T X),得到d\|X\|_F^2 = 2tr(X^T dX)。我漏写个系数2。fro范数的定义:XF2=tr(XTX),得到dXF2=2tr(XTdX)。我漏写个系数2

我试着推算了下,但是没有完全推出来:

d∥X∥F2=dtr(XTX)=tr[d(XTX)]=tr[d(XT)X+XTdX]=tr[d(XT)X]+tr[XTdX]=tr[Xd(XT)]+tr[XTdX] \begin{align} \begin{split} d\|X\|_F^{2} & =d tr(X^T X) \\ & = tr [d(X^T X)] \\ & = tr [d(X^T) X + X^TdX] \\ & = tr [d(X^T) X] + tr[X^TdX] \\ & = tr [Xd(X^T) ] + tr[X^TdX] \\ \end{split} \end{align} dXF2=dtr(XTX)=tr[d(XTX)]=tr[d(XT)X+XTdX]=tr[d(XT)X]+tr[XTdX]=tr[Xd(XT)]+tr[XTdX]
对比大佬的结果是 2tr(XTdX)2tr(X^T dX)2tr(XTdX), 则我的推算中应该存在如下等式:
tr[XdXT]=tr(XTdX) \begin{align} \begin{split} tr [XdX^T ] =tr(X^T dX) \end{split} \end{align} tr[XdXT]=tr(X

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值