文章目录
元素向量矩阵求导法则【如果你在学习过程,遇到问题,可以请我做私教!老司机带你飞!】
公式都是,我一行行,通过markdown敲出来的,经过验证的,正确无误的~
1、行向量对元素求导
设 y T = [ y 1 ⋯ y n ] y^T = [y_1\ \cdots\ y_n] yT=[y1 ⋯ yn] 是 n 维行向量, x x x 是元素,则 ∂ y T ∂ x = [ ∂ y 1 ∂ x ⋯ ∂ y n ∂ x ] \frac{\partial y^T}{\partial x} = [\frac{\partial y_1}{\partial x} \ \cdots\ \frac{\partial y_n}{\partial x}] ∂x∂yT=[∂x∂y1 ⋯ ∂x∂yn]
2、列向量对元素求导
设 y = [ y 1 ⋮ y n ] y = \left[ \begin{matrix}y_1\\\vdots\\y_n\end{matrix}\right] y=⎣⎢⎡y1⋮yn⎦⎥⎤ 是 m 维列向量, x x x 是元素,则:
∂ y ∂ x = [ ∂ y 1 ∂ x ⋮ ∂ y n ∂ x ] \frac{\partial y}{\partial x} = \left[\begin{matrix}\frac{\partial y_1}{\partial x}\\\vdots\\\frac{\partial y_n}{\partial x}\end{matrix}\right] ∂x∂y=⎣⎢⎡∂x∂y1⋮∂x∂yn⎦⎥⎤
3、矩阵对元素求导
设 Y = [ y 11 ⋯ y 1 n ⋮ ⋮ ⋮ y m 1 ⋯ y m n ] Y = \left[\begin{matrix}&y_{11}\ \ &\cdots \ \ &y_{1n}\\&\vdots\ \ &\vdots \ \ &\vdots\\&y_{m1}\ \ &\cdots \ \ &y_{mn}\end{matrix}\right] Y=⎣⎢⎡y11 ⋮ ym1 ⋯ ⋮ ⋯ y1n⋮ymn⎦⎥⎤
是 m × n m \times n m×n 矩阵, x x x 是元素,则
∂ Y ∂ x = [ ∂ y 11 ∂ x ⋯ ∂ y 1 n ∂ x ⋮ ⋮ ⋮ ∂ y m 1 ∂ x ⋯ ∂ y m n ∂ x ] \frac{\partial Y}{\partial x } = \left[\begin{matrix}&\frac{\partial y_{11}}{\partial x}\ \ &\cdots \ \ &\frac{\partial y_{1n}}{\partial x}\\&\vdots\ \ &\vdots\ \ &\vdots\\&\frac{\partial y_{m1}}{\partial x}\ \ &\cdots\ \ &\frac{\partial y_{mn}}{\partial x}\end{matrix}\right] ∂x∂Y=⎣⎢⎡∂x∂y11 ⋮ ∂x∂ym1 ⋯ ⋮ ⋯ ∂x∂y1n⋮∂x∂ymn⎦⎥⎤
4、元素对行向量求导
设 y y y 是元素, x T = [ x 1 ⋯ x n ] x^T = [x_1\ \ \cdots\ \ x_{n}] xT=[x1 ⋯ xn] 是 n 维行向量,则
∂ y ∂ x T = [ ∂ y ∂ x 1 ⋯ ∂ y ∂ x n ] \frac{\partial y}{\partial x^T} = [\frac{\partial y}{\partial x_1}\ \ \cdots\ \ \frac{\partial y}{\partial x_n}] ∂xT∂y=[∂x1∂y ⋯ ∂xn∂y]
5、元素对列向量求导
设 y y y 是元素, x = [ x 1 ⋮ x n ] x = \left[ \begin{matrix}x_1\\\vdots\\x_n\end{matrix}\right] x=⎣⎢⎡x1⋮xn⎦⎥⎤ 是 n 维列向量,则
∂ y ∂ x = [ ∂ y ∂ x 1 ⋮ ∂ y ∂ x n ] \frac{\partial y}{\partial x} = \left[\begin{matrix}\frac{\partial y}{\partial x_1}\\\vdots\\\frac{\partial y}{\partial x_n}\end{matrix}\right] ∂x∂y=⎣⎢⎡∂x1∂y⋮∂xn∂y⎦⎥⎤
6、元素对矩阵求导
设 X = [ x 11 ⋯ x 1 n ⋮ ⋮ ⋮ x m 1 ⋯ x m n ] X = \left[\begin{matrix}&x_{11}\ \ &\cdots \ \ &x_{1n}\\&\vdots\ \ &\vdots \ \ &\vdots\\&x_{m1}\ \ &\cdots \ \ &x_{mn}\end{matrix}\right] X=⎣⎢⎡x11 ⋮ xm1 ⋯ ⋮ ⋯ x1n⋮xmn⎦⎥⎤
是 m × n m \times n m×n 矩阵, y y y 是元素,则
∂ y ∂ X = [ ∂ y ∂ x 11 ⋯ ∂ y ∂ x 1 n ⋮ ⋮ ⋮ ∂ y ∂ x m 1 ⋯ ∂ y ∂ x m n ] \frac{\partial y}{\partial X} = \left[\begin{matrix}&\frac{\partial y}{\partial x_{11}}\ \ &\cdots\ \ &\frac{\partial y}{\partial x_{1n}}\\&\vdots\ \ &\vdots\ \ &\vdots\\&\frac{\partial y}{\partial x_{m1}}\ \ &\cdots\ \ &\frac{\partial y}{\partial x_{mn}}\end{matrix}\right] ∂X∂y=⎣⎢⎡∂x11∂y ⋮ ∂xm1∂y ⋯ ⋮ ⋯

本文详细介绍了元素、向量及矩阵之间的各种求导法则,包括行向量、列向量以及矩阵对元素、向量和矩阵自身的求导规则,并通过两个具体案例进行了解析。
最低0.47元/天 解锁文章

被折叠的 条评论
为什么被折叠?



