矩阵向量求导链式法则

最新推荐文章于 2025-10-15 08:26:45 发布

翻译最新推荐文章于 2025-10-15 08:26:45 发布 · 4.4k 阅读

·

4

·

CC 4.0 BY-SA版权

原文链接：https://www.cnblogs.com/pinard/p/10825264.html

文章标签：

1. 向量对向量求导的链式法则

首先我们来看看向量对向量求导的链式法则。假设多个向量存在依赖关系，比如三个向量x→y→z存在依赖关系，则我们有下面的链式求导法则：

2. 标量对多个向量的链式求导法则

在我们的机器学习算法中，最终要优化的一般是一个标量损失函数，因此最后求导的目标是标量，无法使用上一节的链式求导法则，比如2向量，最后到1标量的依赖关系：x→y→z，此时很容易发现维度不相容。

　如果是标量对更多的向量求导,比如y1→y2→...→yn→zy1→y2→...→yn→z，则其链式求导表达式可以表示为：

3. 标量对多个矩阵的链式求导法则

下面我们再来看看标量对多个矩阵的链式求导法则，假设有这样的依赖关系：X→Y→z那么我们有：

机器学习常用矩阵求导：

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。