一个F范数对矩阵求导例子 1

本文通过三个具体实例,详细解析了标量对矩阵求导的过程,包括F范数平方的求导、矩阵差的F范数平方求导及涉及点乘运算的矩阵表达式的求导。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

==PART1 ==

1. 问题

如何求下列表达式中的未知参数W?求偏导?
min⁡f(W)=min⁡w∥(XW∘D˘)B∥F2(0) \min f(W)=\min_w \|(XW \circ \breve{D})B\|_F^2 \tag{0} minf(W)=wmin(XWD˘)BF2(0)
其中 只有W是未知参数\textcolor{red}{只有W是未知参数}只有W是未知参数,且X∈Rn×m,W∈Rm×c,D˘∈Rn×c,B∈Rc×cX \in R^{n \times m}, W \in R^{m \times c}, \breve{D} \in R^{n \times c}, B \in R^{c \times c}XRn×m,WRm×c,D˘Rn×c,BRc×c
同时∘\circ 表示 Hadamard积,即矩阵按位乘(matlab的点乘)。

2. 推导过程

S=XW∘D˘S=XW \circ \breve{D}S=XWD˘,则
f(W)=∥(XW∘D˘)B∥F2=∥SB∥F2=tr(SBBTST)(1) f(W)=\|(XW \circ \breve{D})B\|_F^2 \\ = \|SB\|_F^2 \\ =tr(SBB^TS^T) \tag{1} f(W)=(XWD˘)BF2=SBF2=tr(SBBTST)(1)
由于有∂tr(XBXT)∂X=XBT+XB,(2)\frac{\partial{tr(XBX^T)}}{\partial{X}}=XB^T + XB \tag{2}, Xtr(XBXT)=XBT+XB(2)
所以
∂f∂S=SBBT+SBBT=2SBBT(3) \frac{\partial{f}}{\partial{S}}=SBB^T + SBB^T=2SBB^T \tag{3} Sf=SBBT+SBBT=2SBBT(3)
继续求解:
df=tr[(∂f∂S)TdS]=tr[(∂f∂S)Td(XW∘D˘)]=tr[(∂f∂S)T(d(XW)∘D˘)]=tr[(∂f∂S)T(XdW∘D˘)]=tr[(∂f∂S)T(D˘∘XdW)]=tr[(∂f∂S∘D˘)TXdW)]=tr[(XT(∂f∂S∘D˘))TdW] df=tr[(\frac{\partial{f}}{\partial{S}})^TdS]=tr[(\frac{\partial{f}}{\partial{S}})^Td(XW \circ \breve{D})] \\ =tr[(\frac{\partial{f}}{\partial{S}})^T(d(XW)\circ\breve{D}) ] \\ =tr[(\frac{\partial{f}}{\partial{S}})^T(XdW\circ\breve{D})] \\ =tr[(\frac{\partial{f}}{\partial{S}})^T(\breve{D} \circ XdW)] \\ =tr[(\frac{\partial{f}}{\partial{S}} \circ \breve{D})^TXdW)] \\ =tr[(X^T(\frac{\partial{f}}{\partial{S}} \circ \breve{D}))^TdW] \\ df=tr[(Sf)TdS]=tr[(Sf)Td(XWD˘)]=tr[(Sf)T(d(XW)D˘)]=tr[(Sf)T(XdWD˘)]=tr[(Sf)T(D˘XdW)]=tr[(SfD˘)TXdW)]=tr[(XT(SfD˘))TdW]
所以:
∂f∂W=XT(∂f∂S∘D˘)=XT[(2SBBT)∘D˘]=XT(2(XW∘D˘)BBT∘D˘) \frac{\partial{f}}{\partial{W}}=X^T(\frac{\partial{f}}{\partial{S}} \circ \breve{D})=X^T[(2SBB^T) \circ \breve{D}] \\ =X^T(2(XW \circ \breve{D})BB^T\circ \breve{D} ) Wf=XT(SfD˘)=XT[(2SBBT)D˘]=XT(2(XWD˘)BBTD˘)

3. 说明

  • 本篇内容属于标量对矩阵的求导,还有更难的矩阵对矩阵求导
  • 本文内容经 矩阵求导术 相关内容推导而来,更详细说明请参阅矩阵求导术相关内容 https://blog.youkuaiyun.com/lgl123ok/article/details/120780368
  • 重点公式:
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

==PART2 ==

问题2: ∥XW−Z∥F2\|XW-Z\|_F^2XWZF2对W求偏导是多少?
答:令 f(W)=∥XW−Z∥F2f(W)=\|XW-Z\|_F^2f(W)=XWZF2, S=XW-Z
∂f∂S=2S=2(XW−Z) \frac{\partial{f}}{\partial{S}}=2S=2(XW-Z) Sf=2S=2(XWZ)

df=tr[(∂f∂S)TdS]=tr[(∂f∂S)Td(XW−Z)]=tr[(∂f∂S)T(XdW)]=tr[(XT∂f∂S)TdW] df=tr[(\frac{\partial{f}}{\partial{S}})^TdS]=tr[(\frac{\partial{f}}{\partial{S}})^Td(XW -Z)] \\ =tr[(\frac{\partial{f}}{\partial{S}})^T(XdW) ] \\ =tr[(X^T\frac{\partial{f}}{\partial{S}})^TdW ] \\ df=tr[(Sf)TdS]=tr[(Sf)Td(XWZ)]=tr[(Sf)T(XdW)]=tr[(XTSf)TdW]
所以:
∂f∂W=XT∂f∂S=XT[2(XW−Z)]=2XT(XW−Z) \frac{\partial{f}}{\partial{W}}=X^T\frac{\partial{f}}{\partial{S}} =X^T[2(XW-Z)] \\ =2X^T(XW-Z) Wf=XTSf=XT[2(XWZ)]=2XT(XWZ)
结论是正确的,参 Multi-label feature selection via manifold regularization and
dependence maximization 的第11式。


==PART3 ==

问题3: ∥Q−W∘A+1ρΓ1∥F2\|Q- W \circ A + \frac{1}{\rho}\Gamma_1\|_F^2QWA+ρ1Γ1F2对W求偏导是多少? 圈是点乘。
答:令 f(W)=∥Q−W∘S+1ρΓ1∥F2f(W)=\|Q- W \circ S + \frac{1}{\rho}\Gamma_1\|_F^2f(W)=QWS+ρ1Γ1F2, S=Q−W∘S+1ρΓ1S=Q- W \circ S + \frac{1}{\rho}\Gamma_1S=QWS+ρ1Γ1
∂f∂S=2S=2(Q−W∘A+1ρΓ1) \frac{\partial{f}}{\partial{S}}=2S=2(Q- W \circ A + \frac{1}{\rho}\Gamma_1) Sf=2S=2(QWA+ρ1Γ1)

df=tr[(∂f∂S)TdS]=tr[(∂f∂S)Td(Q−W∘A+1ρΓ1)]=tr[(∂f∂S)T(−A∘dW)]=tr[(∂f∂S∘(−A))TdW] df=tr[(\frac{\partial{f}}{\partial{S}})^TdS]=tr[(\frac{\partial{f}}{\partial{S}})^Td(Q- W \circ A + \frac{1}{\rho}\Gamma_1)] \\ =tr[(\frac{\partial{f}}{\partial{S}})^T(-A \circ dW) ] \\ =tr[(\frac{\partial{f}}{\partial{S}} \circ (-A))^TdW ] \\ df=tr[(Sf)TdS]=tr[(Sf)Td(QWA+ρ1Γ1)]=tr[(Sf)T(AdW)]=tr[(Sf(A))TdW]
所以:
∂f∂W=∂f∂S∘(−A)=2(Q−W∘A+1ρΓ1)∘(−A)=−2(Q−W∘A+1ρΓ1)∘A \frac{\partial{f}}{\partial{W}}=\frac{\partial{f}}{\partial{S}} \circ (-A) =2(Q- W \circ A + \frac{1}{\rho}\Gamma_1) \circ (-A) \\ =-2(Q- W \circ A + \frac{1}{\rho}\Gamma_1) \circ A Wf=Sf(A)=2(QWA+ρ1Γ1)(A)=2(QWA+ρ1Γ1)A

这个只能适当参考。

评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值