定义1. 梯度(Gradient)[标量对列向量微分]
设f(x)是一个变量为x的标量函数,其中
梯度的转置是一个行向量:
定义2. 海塞矩阵(Hessian matrix)【海塞矩阵是二阶梯度】
设f(x)是一个二阶可微分的标量函数,其中x=(x1...xN)T。那么定义f(x)对x的海塞矩阵为
海塞矩阵是对称阵。
定义3. 雅可比矩阵(Jacobian matrix)【雅可比矩阵本质上是一阶梯度,向量对向量微分】
设f(x)是一个K X 1的列向量函数
其中x=(x1...xL)T。那么定义f(x)对x的雅可比矩阵为
定义4. [矩阵对标量微分]
M×N的矩阵 A的元素是一个向量
矩阵的二阶微分:
定理1. 矩阵的乘积微分
A是
证明过程如下:
定理2.
A是

本文介绍了矩阵微分的基本概念,包括梯度、海塞矩阵、雅可比矩阵以及矩阵乘积和逆矩阵的微分。通过实例展示了矩阵微分在机器学习中的应用,特别是矩阵迹的微分及其在优化问题中的作用,如线性回归模型中权重矩阵的求解。文中提出了一套计算矩阵微分的规律,并通过例子验证了其正确性。
最低0.47元/天 解锁文章
2万+

被折叠的 条评论
为什么被折叠?



