机器学习中的矩阵向量求导(一) 求导定义与求导布局

这篇博客是关于机器学习中矩阵向量求导的介绍,包括求导定义、布局以及基础总结。讨论了向量对标量、标量对向量的求导,重点介绍了雅克比矩阵和梯度矩阵的概念。博客提到了分子布局和分母布局的选择,以及混合布局在实际应用中的使用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

  在之前写的上百篇机器学习博客中,不时会使用矩阵向量求导的方法来简化公式推演,但是并没有系统性的进行过讲解,因此让很多朋友迷惑矩阵向量求导的具体过程为什么会是这样的。这里准备用几篇博文来讨论下机器学习中的矩阵向量求导,今天是第一篇。

    本系列主要参考文献为维基百科的Matrix Caculas和张贤达的《矩阵分析与应用》。

1. 矩阵向量求导引入

    在高等数学里面,我们已经学过了标量对标量的求导,比如标量yy对标量xx的求导,可以表示为∂y∂x∂y∂x。

    有些时候,我们会有一组标量yi,i=1,2,...,myi,i=1,2,...,m来对一个标量xx的求导,那么我们会得到一组标量求导的结果:

∂yi∂x,i=1,2.,,,m∂yi∂x,i=1,2.,,,m

    如果我们把这组标量写成向量的形式,即得到维度为m的一个向量yy对一个标量xx的求导,那么结果也是一个m维的向量:∂y∂x∂y∂x

    可见,所谓向量对标量的求导,其实就是向量里的每个分量分别对标量求导,最后把求导的结果排列在一起,按一个向量表示而已。类似的结论也存在于标量对向量的求导,向量对向量的求导,向量对矩阵的求导,矩阵对

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

文宇肃然

精神和物质鼓励你选一个吧

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值