闲话矩阵求导
本博客转载自:http://xuehy.github.io/2014/04/18/2014-04-18-matrixcalc/
矩阵求导,想必许多领域能见到。统计学,经济学,优化,机器学习等等,在对目标问题建立数学模型之后,问题往往被抽象为关于矩阵的优化问题。于是免不了需要对矩阵进行求导等操作。
简单的向量和矩阵求导,大多数熟悉这些计算的人,应该都能直接写下,然而复杂的矩阵函数求导则没那么简单,著名的matrix cookbook为广大的研究者们提供了一本大字典,里面有着各种简单到复杂矩阵和向量的求导法则,但是如果你的好奇心和我一样重,那么你肯定不会满足于查字典这种方法,特别是在推导公式一气呵成满纸乱飞的时候,查字典岂不是大煞风景?
事实上,所有求导的法则都可以从最基本的求导规则推导出来。不知你有没发现,不同的文献中,同样的式子求导的结果有时候会不一样,仔细观察会发现刚好相差一个转置,于是我们得先说说求导的两个派别(布局)。
本文探讨了矩阵求导在多个领域的应用,如统计学、经济学、优化及机器学习等,并强调了从基本规则出发推导复杂函数的重要性。文章还提到了不同文献中相同的式子求导结果可能存在的差异,主要源于求导的不同布局。
5万+

被折叠的 条评论
为什么被折叠?



