在数学中,海森矩阵(Hessian matrix或Hessian)是一个自变量为向量的实值函数的二阶偏导数组成的方块矩阵,此函数如下:
如果f所有的二阶导数都存在,那么f的海森矩阵即:
其中
,即
(也有人把海森定义为以上矩阵的行列式) 海森矩阵被应用于牛顿法解决的大规模优化问题。
在
→
的函数的应用[编辑]
给定二阶导数连续的函数
,海森矩阵的行列式,可用于分辨
的临界点是属于鞍点还是极值点。
对于
的临界点
一点,有
,然而凭一阶导数不能判断它是鞍点、局部极大点还是局部极小点。海森矩阵可能解答这个问题。
- H > 0:若
,则
是局部极小点;若
,则
是局部极大点。 - H < 0:
是鞍点。 - H = 0:二阶导数无法判断该临界点的性质,得从更高阶的导数以泰勒公式考虑。
在高维情况下的推广[编辑]
当函数
二阶连续可导时,Hessian矩阵H在临界点
上是一个
阶的对称矩阵。
本文介绍了海森矩阵的概念及其在函数优化中的应用。海森矩阵由实值函数的二阶偏导数组成,用于判别临界点的性质,如局部极小点、局部极大点或鞍点,并详细讨论了不同情况下海森矩阵的特征。
8411

被折叠的 条评论
为什么被折叠?



