基本说明
- 矩阵求导无非就是:一个矩阵里的元素对另一个矩阵里的元素进行对应求导,只要符合一些规则而已;这些规则就是:
- 分子布局(Numerator layout):即分子为列向量,分母为行向量
- 分母布局(Denominator layout):即分子为行向量,分母为列向量
- 分子布局(Numerator layout)
- 假设:x,y为常数 x ⃗ = [ x 1 , x 2 , … , x n ] T \vec{x}=[x_1,x_2,…,x_n ]^T x=[x1,x2,…,xn]T y ⃗ = [ y 1 , y 2 , … , y m ] T \vec{y}=[y_1,y_2,…,y_m ]^T y=[y1,y2,…,ym]T X = [ x 11 , x 12 ⋯ x 1 n x 21 , x 22 ⋯ x 2 n ⋮ , ⋮ ⋱ ⋮ x n 1 , x n 2 ⋯ x n n ] X=\begin{bmatrix} x_{11},x_{12} & \cdots & x_{1n} \\ x_{21},x_{22} & \cdots & x_{2n} \\ \vdots ,\vdots & \ddots & \vdots \\ x_{n1},x_{n2} & \cdots & x_{nn} \\ \end{bmatrix} X=⎣⎢⎢⎢⎡x11,x12x21,x22⋮,⋮xn1,xn2⋯⋯⋱⋯x1nx2n⋮xnn⎦⎥⎥⎥⎤ Y = [ y 11 , y 12 ⋯ y 1 n y 21 , y 22 ⋯ y 2 n ⋮ , ⋮ ⋱ ⋮ y n 1 , y n 2 ⋯ y n n ] Y=\begin{bmatrix} y_{11},y_{12} & \cdots & y_{1n} \\ y_{21},y_{22} & \cdots & y_{2n} \\ \vdots ,\vdots & \ddots & \vdots \\ y_{n1},y_{n2} & \cdots & y_{nn} \\ \end{bmatrix} Y=⎣⎢⎢⎢⎡