一个简单的矩阵范数求偏导小例子

这篇博客详细探讨了如何计算目标函数F(P,Q)=min_P,Q∥X−PQ∥_F^2+α∥P∥_F^2+α∥Q∥_F^2关于P和Q的偏导数。通过矩阵微积分的规则,博主展示了从原始函数到偏导数的推导过程,最终得到∂F/∂P=−2XQT+2PQQT+2αP和∂F/∂Q=−2PTX+2PTPQ+2αQ的结果。这个过程对于理解和应用矩阵优化问题至关重要。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

问题:如果有以下目标函数,则其对P,Q的求导结果是怎样的,怎么来的?这个问题困扰了我非常久,费了不少劲,特此记录下。
在这里插入图片描述

F(P,Q)=min⁡P,Q∥X−PQ∥F2+α∥P∣F2+α∥Q∣F2∂F∂P=?,∂F∂Q=?并且整个推导过程是怎么样的? F(P,Q)=\min_{P,Q} \|X-PQ\|_F^2+\alpha \|P|_F^2+\alpha \|Q|_F^2 \\ \frac{\partial{F}}{\partial{P}}=\textcolor{red}{?}, \quad \frac{\partial{F}}{\partial{Q}}=\textcolor{red}{?} \\ 并且整个推导过程是怎么样的? F(P,Q)=P,QminXPQF2+αPF2+αQF2PF=?,QF=?


1. 常用公式:

∥X∥F2=tr(XXT)(54) \|X\|_F^2=tr(XX^T) \tag{54} XF2=tr(XXT)(54)
(A+B)T=AT+BT(4) (A+B)^T=A^T+B^T \tag{4} (A+B)T=AT+BT(4)tr(A)=tr(AT)(13) tr(A)=tr(A^T) \tag{13} tr(A)=tr(AT)(13)∂∥x∥22∂x=2x,x是向量(131) \frac{\partial{\| x\|_2^2}}{\partial{x}}=2x, \quad x是向量 \tag{131} xx22=2x,x(131)∂∥X∥F2∂X=2X,X是矩阵(132) \frac{\partial{\|X\|_F^2}}{\partial{X}}=2X , \quad X是矩阵 \tag{132} XXF2=2X,X(132)∂tr(F(X))∂X=f(X)T,其中f(X)是F(X)的标量导数(98-99) \frac{\partial{tr(F(X))}}{\partial{X}}=f(X)^T \tag{98-99} ,其中f(X)是F(X)的标量导数 Xtr(F(X))=f(X)Tf(X)F(X)(98-99)∂tr(XBXT)∂X=XBT+XB(111) \frac{\partial{tr(XBX^T)}}{\partial{X}}=XB^T + XB \tag{111} Xtr(XBXT)=XBT+XB(111)∂tr(AXBXTC)∂X=ATCTXBT+CAXB(118) \frac{\partial{tr(AXBX^TC)}}{\partial{X}}=A^TC^TXB^T + CAXB \tag{118} Xtr(AXBXTC)=ATCTXBT+CAXB(118)∂A=0,A是一个常量矩阵(33) \partial{A}=0, \quad A是一个常量矩阵 \tag{33} A=0A(33)∂(XY)=∂(X)Y+X∂(Y),matmulproduct(一般矩阵乘积)(37) \partial{(XY)}=\partial{(X )} Y + X \partial{(Y)}, \quad matmul product(一般矩阵乘积)\tag{37} (XY)=(X)Y+X(Y)matmulproduct(37)∂(X∘Y)=∂(X)∘Y+X∘∂(Y),Hadamard积(38) \partial{(X \circ Y)}=\partial{(X )} \circ Y + X \circ \partial{(Y)}, \quad Hadamard积\tag{38} (XY)=(X)Y+X(Y)Hadamard(38)∂(X⊗Y)=∂(X)⊗Y+X⊗∂(Y),Kronecker积(39) \partial{(X \otimes Y)}=\partial{(X )} \otimes Y + X \otimes \partial{(Y)} , \quad Kronecker 积 \tag{39} (XY)=(X)Y+X(Y),Kronecker(39)

2. 问题推导:

先对目标函数进行整理:
F(P,Q)=∥X−PQ∥F2+α∥P∣F2+α∥Q∣F2=tr((X−PQ)(X−PQ)T)+αtr(PPT)+αtr(QQT)=tr((X−PQ)(XT−QTPT))+αtr(PPT)+αtr(QQT)=tr(XXT)−tr(PQXT)−tr(XQTPT)+tr(PQQTPT)+αtr(PPT)+αtr(QQT)=tr(XXT)−2tr(PQXT)+tr(PQQTPT)+αtr(PPT)+αtr(QQT) F(P,Q) = \|X-PQ\|_F^2+\alpha \|P|_F^2+\alpha \|Q|_F^2 \\ = tr((X-PQ)(X-PQ)^T)+\alpha tr(PP^T)+\alpha tr(QQ^T) \\ = tr((X-PQ)(X^T-Q^TP^T))+\alpha tr(PP^T)+\alpha tr(QQ^T) \\ = tr(XX^T)-tr(PQX^T)-tr(XQ^TP^T)+tr(PQQ^TP^T)+\alpha tr(PP^T)+\alpha tr(QQ^T) \\ = tr(XX^T)-2tr(PQX^T)+tr(PQQ^TP^T)+\alpha tr(PP^T)+\alpha tr(QQ^T) \\ F(P,Q)=XPQF2+αPF2+αQF2=tr((XPQ)(XPQ)T)+αtr(PPT)+αtr(QQT)=tr((XPQ)(XTQTPT))+αtr(PPT)+αtr(QQT)=tr(XXT)tr(PQXT)tr(XQTPT)+tr(PQQTPT)+αtr(PPT)+αtr(QQT)=tr(XXT)2tr(PQXT)+tr(PQQTPT)+αtr(PPT)+αtr(QQT)

∂F∂P=0−2(QXT)T+P(QQT)T+P(QQT)+αP1T+αP1+0=−2XQT+PQQT+PQQT+2αP=−2XQT+2PQQT+2αP \frac{\partial{F}}{\partial{P}} = 0-2(QX^T)^T+P(QQ^T)^T+ P(QQ^T)+\alpha P1^T+\alpha P1+0 \\ = -2XQ^T+PQQ^T+ PQQ^T+2 \alpha P \\ = -2XQ^T+2PQQ^T+2 \alpha P PF=02(QXT)T+P(QQT)T+P(QQT)+αP1T+αP1+0=2XQT+PQQT+PQQT+2αP=2XQT+2PQQT+2αP
同理:
∂F∂Q=−2PTX+2PTPQ+2αQ \frac{\partial{F}}{\partial{Q}} = -2P^TX+2P^TPQ+2 \alpha Q QF=2PTX+2PTPQ+2αQ

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值