机器学习之深入理解矩阵求导的基本方法

一、分子布局、分母布局

前提: 若 x 为向量,则默认 x x x 为列向量, x T x^T xT 为行向量

布局简单地理解就是分子 y 、分母 x 是行向量还是列向量。

  • 分子布局(Numerator-layout): 分子为 y y y 或者分母为 x T x^T xT(即分子为列向量或者分母为行向量)
  • 分母布局(Denominator-layout): 分子为 y T y^T yT 或者分母为 x x x(即分子为行向量或者分母为列向量)
1. 分子布局
  • 标量/向量:
    在这里插入图片描述(分子为标量,分母的向量为行向量)

  • 向量/标量:
    在这里插入图片描述(分子的向量为列向量,分母为标量)

  • 向量/向量:
    在这里插入图片描述(分子为列向量横向平铺,分母为行向量纵向平铺)

  • 标量/矩阵:
    在这里插入图片描述(分子为标量,分母为矩阵的转置)

  • 矩阵/标量:
    在这里插入图片描述(分子为矩阵的转置,分母为标量)

2. 分母布局
  • 标量/向量:
    在这里插入图片描述(分子为标量,分母的向量为列向量)

  • 向量/标量:
    在这里插入图片描述(分子的向量为行向量,分母为标量)

  • 向量/向量:
    在这里插入图片描述(分子为行向量纵向平铺,分母为列向量横向平铺)

  • 标量/矩阵:
    在这里插入图片描述(分子为标量,分母的矩阵为原始矩阵)

二、几个重要的定义

定义1、梯度(Gradient)

f ( x ) f(x) f(x)是一个变量为 x x x的标量函数,其中 x = ( x 1 . . . x N ) T x=(x_1...x_N)^T x=(x1...xN)T。那么定义 f ( x ) f(x) f(x) x x x的梯度为 d f ( x ) d x \frac{d f(x)}{d x} dxdf(x)
在这里插入图片描述
梯度的转置是一个行向量:
在这里插入图片描述

定义2. 海塞矩阵(Hessian matrix)

f ( x ) f(x) f(x)是一个二阶可微分的标量函数,其中 x = ( x 1 . . . x N ) T x=(x_1...x_N)^T x=(x1...xN)T。那么定义 f ( x ) f(x) f(x) x x x的海塞矩阵为 d 2 f ( x ) d x d x T \frac{d^{2} f(x)}{d x d x^{T}} dxdxTd2f(x)

在这里插入图片描述

定义3. 雅可比矩阵(Jacobian matrix)

f ( x ) f(x) f(x)是一个K x 1的列向量函数
在这里插入图片描述
其中 x = ( x 1 . . . x L ) T x=(x_1...x_L)^T x=(x1...xL)T。那么定义 f ( x ) f(x) f(x) x x x的雅可比矩阵为 d f ( x ) d x T \frac{d f(x)}{d x^{T}} dxTdf(x)

在这里插入图片描述

定义4. 矩阵对标量微分

M × N的矩阵 A A A的元素是一个向量 x x x的元素 x q x_q xq的函数,定义 ∂ A ∂ x q \frac{\partial A}{\partial x_{q}} xqA为:

在这里插入图片描述
矩阵的二阶微分:
在这里插入图片描述

三、矩阵迹的微分(Derivative of Traces)

在机器学习中,有时候需要对一个矩阵的F模进行微分,而矩阵的F是可以转换为矩阵的迹,矩阵的迹的微分的计算可以帮助我们计算矩阵的F模的微分。矩阵的F模和迹的关系:

在这里插入图片描述
其中 A ∗ A^∗ A A A A的共轭转置。矩阵的迹的性质:

在这里插入图片描述
∂ ∂ x tr ⁡ ( F ( x ) ) = f ( x ) T \frac{\partial}{\partial x} \operatorname{tr}(F(x))=f(x)^{T} xtr(F(x))=f(x)T

其中, f ( ) f() f() F ( ) F() F()的微分。

一阶:
在这里插入图片描述
二阶:
在这里插入图片描述
高阶:
在这里插入图片描述

如果想要更多的资源,欢迎关注 @我是管小亮,文字强迫症MAX~

回复【福利】即可获取我为你准备的大礼,包括C++,编程四大件,NLP,深度学习等等的资料。

想看更多文(段)章(子),欢迎关注微信公众号「程序员管小亮」~

在这里插入图片描述

参考文章:
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

我是管小亮

一口吃掉你的打赏,嗝~

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值