数学:矩阵求导

本文探讨了矩阵求导的基本规则,包括标量对矩阵、矩阵对标量、向量对向量以及矩阵对矩阵的求导。重点指出在不同情况下,求导结果可能涉及转置、矩阵形状变化以及构成超向量或超矩阵等特性。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

  • 矩阵Y对标量x求导:
Y = [ y(ij) ]
dY / dx = [ dy(ji) / dx ]

求导后,Y变转置了。


  • 标量y对矩阵X求导:
dy / dX = [ Dy/Dx(ij) ]

求导后,不需要转置。

//重要结论
y = U'XV = ΣΣu(i)x(ij)v(j)于是 dy/dX = [u(i)v(j)] = UV'
y = U'X'XU 则 dy/dX =2XUU'
y = (XU-V)'(XU-V) 则 dy/dX =d(U'X'XU - 2V'XU + V'V)/dX = 2XUU' - 2VU' + 0 = 2(XU-V)U'

  • 标量y对列向量X求导:
y = f(x1, x2, ..., xn)
dy / dX = [ Dy / Dx(1), Dy / Dx(2), ..., Dy / Dx(n) ] <列向量>

求导后,还是列向量


  • 行向量Y对列向量X求导:
    1M 向量对 N1 向量求导为 N*M 矩阵
// 重要结论
dX <行向量> / dX <列向量>  = I <单位阵>
d(AX) <列向量> / dX <行向量> = A <T>

  • 列向量Y对
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值