[笔记] 最优化方法 - 凸集

凸集的定义、性质

SEn ,若对 x(1),x(2)S λ[0,1] ,都有 λx(1)+(1λ)x(2)S ,则称 S 凸集

S1 S2 是两个凸集, β 实数,则
- βS1={βxxS1} 是凸集
- S1+S2={x(1)+x(2)x(1)S1,x(2)S2} 是凸集
- S1S2={x(1)x(2)x(1)S1,x(2)S2} 是凸集
- S1S2 是凸集

极点和极方向的定义

  • 极点

    S 是非空集合,xS,若 x 不能表示成S中两个不同点的凸组合,即若假设 x=λx(1)+(1λ)x(2) ,必推出 x=x(1)=x(2) ,则称 x 是凸集S极点

  • 方向

    S S 是闭凸集,dd为非零向量,如果对S S 中的每一个xx,有\{ x + \lambda d \mid \lambda \ge 0 \} \subset S {x+λdλ0}S ,则称d d SS方向

    d^{(1)}d^{(2)}S的两个方向,若对任何正数\lambda,有d^{(1)} \neq \lambda d^{(2)},则称d^{(1)}d^{(2)}是两个不同的方向。

    S = \{ x \mid Ax = b, x \ge 0 \} \neq \emptysetd是非零向量,则dS的方向 \iff d \ge 0Ad = 0

  • 极方向

    S的方向d不能表示成该集合的两个不同方向的正的线性组合,则称dS极方向

例:设S = \{ (x_1, x_2)^T \mid x_2 \ge \lvert x_1 \rvert \}, d^{(1)} = (1, 1)^T, d^{(2)} = (-1, 1)^T,则d^{(1)}, d^{(2)}S的极方向。

解:对\forall x \in S, \forall \lambda \ge 0,有
x + \lambda d^{(1)} = (x_1, x_2)^T + \lambda (1, 1)^T = (x_1 + \lambda, x_2 + \lambda)^T
x \in S \implies x_2 \ge \lvert x_1 \rvert
x_2 + \lambda \ge \lvert x_1 \rvert + \lambda \ge \lvert x_1 + \lambda \rvert
\implies \{ x + \lambda d^{(1)} \mid \lambda \ge 0 \} \subset S
d^{(1)}S的方向。

d^{(1)} = \lambda _1 (x_1, x_2)^T + \lambda _2 (y_1, y_2)^T,其中\lambda _1, \lambda _2 \gt 0, (x_1, x_2)^T, (y_1, y_2)^TS的方向,则有
\left\{ \begin{array}{c} 1 = \lambda _1 x_1 + \lambda _2 y_1 \\ 1 = \lambda _1 x_2 + \lambda _2 y_2 \end{array} \right. \implies \lambda _1 x_1 + \lambda _2 y_1 = \lambda _1 x_2 + \lambda _2 y_2
\implies x_1 = \frac{\lambda _2}{\lambda _1} (y_2 - y_1) + x_2
(x_1, x_2)^T, (y_1, y_2)^TS的方向,
\implies x_2 \ge \lvert x_1 \rvert, y_2 \ge \lvert y_1 \rvert, (x_1, x_2)^T \neq 0, (y_1, y_2)^T \neq 0
\implies x_2 \ge \lvert x_1 \rvert = \left \lvert \frac{\lambda _2}{\lambda _1} (y_2 - y_1) + x_2 \right \rvert \implies y_2 \le y_1
y_2 \ge \lvert y_1 \rvert \implies y_2 = y_1 \implies x_2 = x_1 \implies (x_1, x_2)^T = \frac{x_1}{y_1} (y_1, y_2)^T
d^{(1)}S的极方向。

  • 多面集的表示定理

    S = \{ x \mid Ax = b, x \ge 0 \}为非空多面集,则有

    • 极点集非空,且存在有限个极点x^{(1)}, \cdots, x^{(k)}
    • 极方向集合为空集 \iff S有界。若S无界,则存在有限个极方向d^{(1)}, d^{(2)}, \cdots, d^{(l)}
    • x \in S \iff x = \sum _{j = 1}^k \lambda _j x^{(j)} + \sum _{j = 1}^l \mu _j d^{(j)}
      其中\lambda _j \ge 0, j = 1, 2, \cdots, k, \sum _{j = 1}^k \lambda _j = 1
      \mu _j \ge 0, j = 1, 2, \cdots, l

    凸集分离定理

    S_1S_2E^n中两个非空集合,
    H = \{ x \mid p^T x = \alpha \}为超平面,
    如果对\forall x \in S_1,都有p^T x \ge \alpha
    \forall x \in S_2,都有p^x \le \alpha
    则称超平面H分离集合S_1S_2

    • Farkas定理

      Am \times n矩阵,cn维列向量,
      Ax \le 0, c^T x \gt 0有解,
      \iff A^T y = c, y \ge 0无解。

      证:\implies
      设存在y \ge 0,使得A^T y = c
      y^T A = c^T
      \overline{x}Ax \le 0, c^T x \gt 0的一个解,
      则有A \overline{x} \le 0, c^T \overline{x} \gt 0
      \implies y^T A \overline{x} = c^T \overline{x} \gt 0 \quad (1)
      y \ge 0, A \overline{x} \le 0 \implies y^T A \overline{x} \le 0(1)矛盾。

      \impliedby
      A^T y = c, y \ge 0无解,令S = \{ z \mid z = A^T y, y \ge 0 \},则c \notin S
      可以证明S为闭凸集,由凸集分离定理知,
      \exists x \neq 0, \varepsilon \gt 0,使得对
      \forall z \in S,有x^T c \ge \varepsilon + x^T z
      \varepsilon \gt 0 \implies x^T c \gt x^T z
      \implies c^T x \gt z^T x = y^T Ax
      即对任意的y \ge 0,有c^T x \gt y^T Ax \quad (2)
      y = 0,得c^T x \gt 0
      c^T x为一定数,y的分量可取任意大
      \implies(2),必有Ax \le 0
      故非零向量xAx \le 0, c^T x \gt 0的解。

    例:设Am \times n矩阵,Bl \times n矩阵,c \in E^n,证明下列两个系统恰有一个有解:
    系1 Ax \le 0, Bx = 0, c^T x \gt 0,对某些x \in E^n
    系2 A^T y + B^T z = c, y \ge 0,对某些y \in E^nz \in E^l

    证:Bx = 0等价于\left\{ \begin{array}{c} Bx \le 0 \\ Bx \ge 0 \end{array} \right.
    故系统1有解,即
    \begin{bmatrix} A \\ B \\ -B \end{bmatrix} x \le 0, c^T x \gt 0有解。
    由Farkas定理知,
    \begin{pmatrix} A^T & B^T & -B^T \end{pmatrix} \begin{bmatrix} y \\ u \\ v \end{bmatrix} = c, \begin{bmatrix} y \\ u \\ v \end{bmatrix} \ge 0无解。
    z = u - v,则
    A^T y + B^T z = c, y \ge 0无解。
    即系统2无解。

    反之,若系统2有解。即
    \begin{pmatrix} A^T & B^T & -B^T \end{pmatrix} \begin{bmatrix} y \\ u \\ v \end{bmatrix} = c, \begin{bmatrix} y \\ u \\ v \end{bmatrix} \ge 0有解。
    由Farkas定理,知
    \begin{bmatrix} A \\ B \\ -B \end{bmatrix} x \le 0, c^T x \gt 0无解。
    Ax \le 0, Bx = 0, c^T x \gt 0无解,亦即系统1无解。
    综上可得,两个系统恰有一个有解。

    • Gordan定理

      Am \times n矩阵,
      Ax \lt 0有解,
      \iff A^T y = 0, y \ge 0 (y \neq 0)无解。

      证:\implies
      设存在\overline{x},使得A \overline{x} \lt 0
      若存在非零向量y \ge 0,使得A^T y = 0
      则有y^T A = 0\implies y^T A \overline{x} = 0
      A \overline{x} \lt 0 \implies y的各分量不可能为非负数,与y \ge 0矛盾。

      \impliedby
      (证等价命题)即若Ax \lt 0无解,则存在非零向量y \ge 0,使得A^T y = 0
      Ax \lt 0无解,令S_1 = \{ z \mid z = Ax, x \in E^n \}, S_2 = \{ z \mid z \lt 0 \}
      Ax \lt 0无解 \implies S_1 \bigcap S_2 = \emptyset
      由分离定理知,存在非零向量y,使得对\forall x \in E^n, \forall z \in S_2,有y^T Ax \ge y^T z \quad (1)
      特别地,当x = 0时,有y^T z \le 0
      z \lt 0,它的分量可取任意负数 \implies y \ge 0
      (1)中令z \to 0,则对\forall x \in E^n,有
      y^T Ax \ge 0 \quad (2)
      x = -A^T y,代入(2),得-y^T A A^T y \ge 0
      -\lVert A^T y \rVert \ge 0 \implies A^T y = 0
      故存在非零向量y \ge 0,使得A^T y = 0

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值