最优化理论期末复习笔记 Part 2

原创

已于 2024-01-04 14:15:56 修改 · 1.9k 阅读

·

16

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#笔记 #最优化 #凸优化

于 2024-01-03 10:15:58 首次发布

数学基础
线性代数
函数的可微性与展开
凸优化问题
- 凸函数的判断
无约束问题的最优性条件
线搜索
- 精确线搜索
- 非精确线搜索
梯度法和牛顿法
共轭方向法和共轭梯度法
拟牛顿法
有约束的最优化问题
约束最优化问题的最优性条件
约束优化问题的可行方向法
- Zoutendijk 可行方向法
- 梯度投影法
  - 怎么把一个向量投影到边界上
  - 算法流程
罚函数
划重点

拟牛顿法

考：提出的思想是什么

希望用一个对称正定矩阵 B 去近似 Hesse 矩阵 G

或者是用一个对称正定矩阵 H 去近似 Hesse 矩阵 G 的逆

并且要求这个方法比较简单，不然还不如直接求 G

考：方程是什么（条件是什么）

因为 G 满足

$G_{k+1}(x_{k+1}-x_{k}) \approx g_{k+1} - g_{k}$

如果记 $s_k = x_{k+1}-x_{k}, y_k = g_{k+1} - g_{k}$

那么上式转化为

$G_{k+1}s_k \approx y_k$

那么我们的问题就转化为找一个 B 满足

$B_{k+1}s_k \approx y_k$

或者是找一个

实际迭代用一个修正公式

$B_{k+1} = B_k + E_k$

对称秩一校正

考：对称秩一校正公式是怎么得到的

$E_k = a u_k u_k^T$ 一个自由度

因为 $u_k u_k^T$ 这个矩阵的每一列都是 $u_k^T$ 这个列向量的 $u_i$ 倍

所以这个矩阵线性无关的列只有一个，那就是 $u_k^T$ 所以秩为 1

$\alpha(u_k^T s_k)u_k = y_k-B_ks_k$

$s_k$ 是列向量， $u_k^T$ 是行向量， $u_k^T s_k)$ 是一个数，所以 $u_k$ 与 $y_k-B_ks_k$ 平行

所以把 $u_k$ 写成 $y_k-B_ks_k$ 的倍数

初始 $B_0 = I$ 显然是对称正定

之后要确定方向的时候，还是要求解 $G d = - g$ 也就是求解这个 $B d = - g$ 中的 d

也就是要求一个 $B$ 的逆，一般是可以接受的

但是如果你是用 $H$ 取近似 $G$ 的逆

那么直接就能 $d_k = -H_k g_k$ 了

目标函数的计算耗时

一阶导用差分来算的话，至少算两次目标函数，那么更耗时

二阶导同理，至少算四次目标函数，更耗时，所以才要避免计算 G

对称秩二

加两个修正的话，有两个参数，能够修正的范围就更多

现在在推导的时候没有那个关键条件左边的列向量和右边的列向量是平行的

现在的问题是，右端的向量 $y_k-B_ks_k$ 位于左边的 $u_k,v_k$ 张成的平面上

那么其实两个基向量的系数可以任取

那么我们就取一中最简单的情况，就是 $y_k-B_ks_k$ 中的 $y_k$ 与 $u_k$ 平行， $B_ks_k$ 与 $v_k$ 平行

DFP, BFGS

BFGS, DFP 怎么推导得到的

对称正定

考：BFGS, DFP 每一步校正的时候，怎么保证 Bk 对称正定？

还要证明迭代得到的 $B_k$ 也是对称正定，那么就是要求这个条件

书上结论错了，不是说有一个对称正定矩阵 B，就能把这个对称正定矩阵分解为对称正定矩阵 $B^{\frac{1}{2}}B^{\frac{1}{2}}$

这里实际上应该是对称正定矩阵的 Cholesky 分解(Cholesky 分解是 LU 分解对对称正定矩阵的特殊情况)

Cauchy-Schwarz 不等式 $\cdot b)^2 \leqslant (a \cdot a)(b \cdot b)$

同样的是 $\int(a \cdot b)^2 \mathrm{d}x \leqslant \int(a \cdot a)(b \cdot b) \mathrm{d}x$

一个向量像另外一个向量投影再投影回他自身，得到的向量的长度，小于它自身的长度

因为 B 是对称正定，所以 $B d = - g$ 有唯一解 d

同时还有 $0<d^TBd = -d^Tg$ ，所以解得的 d 与下降方向 -g 成锐角，所以能够保证下降

所以之前这一段在证啥来着

所以问题怎么就转化成了保证 $y_k^Ts_k > 0$ ？

那么问题转变成，你怎么保证 $y_k^Ts_k > 0$

对于精确线搜索，有 $g^T_{k+1} d_k = 0$

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。