二元函数对xy同时求导_矩阵求导与矩阵微分

这篇博客探讨了矩阵求导和微分的概念,特别是在处理二元函数和最小二乘问题时的应用。文章详细介绍了矩阵求导的布局约定、定义、函数对矩阵导数的计算,以及更简单的矩阵微分方法,包括加减乘运算、转置、求迹等。通过实例展示了如何利用矩阵微分求解最小二乘问题,指出在求极值问题中矩阵求导的重要性。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

矩阵求导与矩阵微分

符号定义

​ 使用大写的粗体字母表示矩阵

​ 使用小写的粗体字母表示向量

,这里默认为列向量

​ 使用小写的正体字母表示标量

需要明白的是,矩阵求导的意义在哪来,我们回想一下函数求导的意义,最大的作用就是寻找极值,导数为0的位置就是函数极值位置,某个点的导数代表梯度下降的方向。

0.布局约定

​ 当向量对于向量的求导的时候,通常会有两种结果,出现不同结果的原因是所使用的的布局不同。通常布局(Layout)有两种,分子布局(numerator layout)分母布局(denominator layout),简单来说,两种区别在于:

  • 分子布局:分子为向量或者分母为向量
  • 分母布局,分子为向量或者分母为向量

注意到分子布局与分母布局只是相差一个转置。我们考虑的大多数问题都是以函数自变量为一个矩阵或者向量(我们使用列向量),函数值为一个数,采用分母布局,得到的结果的维度将于自变量相同,所以下面都采用分母布局。

1.课本上的定义

在开始之前,先看一下戴华老师的《矩阵论》里面关于矩阵微分的描述:

矩阵

的导数

​ 矩阵

的导数可以表示成:

函数对矩阵的导数

​ 设

元函数
,定义
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值