矩阵求导这个东西好像游离在数分高代(几乎本水的全部知识)之外。我东拼西凑看了好几个文章(打算一会分享),研究的差不多。资料大多数都乱,我简单整理并加上了一些自己的理解。
说在开头:
矩阵求导就是多元函数求导,只不过把自变量写成了矩阵的形式。然后f对A求导就是把原来xn的位置换成f对xn的偏导。
具体method:
1. 变量多次出现的求导法则
就是可以算成对每一次出现求导,分别相加,就是高中学的用来求什么xexp(x)导数的方法。这里推广到了矩阵。
2. 值函数对向量求导:
3.关于矩阵的迹:
通常有个技巧就是把矩阵相乘得来