凸集的定义、性质
设 S⊆En ,若对 ∀x(1),x(2)∈S 及 ∀λ∈[0,1] ,都有 λx(1)+(1−λ)x(2)∈S ,则称 S 为凸集。
设
-
βS1={βx∣x∈S1}
是凸集
-
S1+S2={x(1)+x(2)∣x(1)∈S1,x(2)∈S2}
是凸集
-
S1−S2={x(1)−x(2)∣x(1)∈S1,x(2)∈S2}
是凸集
-
S1⋂S2
是凸集
极点和极方向的定义
极点
设 S 是非空集合,
x∈S ,若 x 不能表示成S 中两个不同点的凸组合,即若假设 x=λx(1)+(1−λ)x(2) ,必推出 x=x(1)=x(2) ,则称 x 是凸集S 的极点。方向
设S S 是闭凸集,d
d 为非零向量,如果对S S 中的每一个xx ,有\{ x + \lambda d \mid \lambda \ge 0 \} \subset S {x+λd∣λ≥0}⊂S ,则称d d 是SS 的方向。设d^{(1)}和d^{(2)}是S的两个方向,若对任何正数\lambda,有d^{(1)} \neq \lambda d^{(2)},则称d^{(1)}和d^{(2)}是两个不同的方向。
设S = \{ x \mid Ax = b, x \ge 0 \} \neq \emptyset,d是非零向量,则d是S的方向 \iff d \ge 0且Ad = 0。
极方向
若S的方向d不能表示成该集合的两个不同方向的正的线性组合,则称d为S的极方向。
例:设S = \{ (x_1, x_2)^T \mid x_2 \ge \lvert x_1 \rvert \}, d^{(1)} = (1, 1)^T, d^{(2)} = (-1, 1)^T,则d^{(1)}, d^{(2)}是S的极方向。
解:对\forall x \in S, \forall \lambda \ge 0,有
x + \lambda d^{(1)} = (x_1, x_2)^T + \lambda (1, 1)^T = (x_1 + \lambda, x_2 + \lambda)^T
x \in S \implies x_2 \ge \lvert x_1 \rvert
而x_2 + \lambda \ge \lvert x_1 \rvert + \lambda \ge \lvert x_1 + \lambda \rvert,
\implies \{ x + \lambda d^{(1)} \mid \lambda \ge 0 \} \subset S
故d^{(1)}是S的方向。
设d^{(1)} = \lambda _1 (x_1, x_2)^T + \lambda _2 (y_1, y_2)^T,其中\lambda _1, \lambda _2 \gt 0, (x_1, x_2)^T, (y_1, y_2)^T是S的方向,则有
\left\{ \begin{array}{c} 1 = \lambda _1 x_1 + \lambda _2 y_1 \\ 1 = \lambda _1 x_2 + \lambda _2 y_2 \end{array} \right. \implies \lambda _1 x_1 + \lambda _2 y_1 = \lambda _1 x_2 + \lambda _2 y_2
\implies x_1 = \frac{\lambda _2}{\lambda _1} (y_2 - y_1) + x_2
(x_1, x_2)^T, (y_1, y_2)^T是S的方向,
\implies x_2 \ge \lvert x_1 \rvert, y_2 \ge \lvert y_1 \rvert, (x_1, x_2)^T \neq 0, (y_1, y_2)^T \neq 0
\implies x_2 \ge \lvert x_1 \rvert = \left \lvert \frac{\lambda _2}{\lambda _1} (y_2 - y_1) + x_2 \right \rvert \implies y_2 \le y_1
y_2 \ge \lvert y_1 \rvert \implies y_2 = y_1 \implies x_2 = x_1 \implies (x_1, x_2)^T = \frac{x_1}{y_1} (y_1, y_2)^T
故d^{(1)}是S的极方向。
多面集的表示定理
设S = \{ x \mid Ax = b, x \ge 0 \}为非空多面集,则有
- 极点集非空,且存在有限个极点x^{(1)}, \cdots, x^{(k)}
- 极方向集合为空集 \iff S有界。若S无界,则存在有限个极方向d^{(1)}, d^{(2)}, \cdots, d^{(l)}
- x \in S \iff x = \sum _{j = 1}^k \lambda _j x^{(j)} + \sum _{j = 1}^l \mu _j d^{(j)}
其中\lambda _j \ge 0, j = 1, 2, \cdots, k, \sum _{j = 1}^k \lambda _j = 1
\mu _j \ge 0, j = 1, 2, \cdots, l
凸集分离定理
设S_1和S_2是E^n中两个非空集合,
H = \{ x \mid p^T x = \alpha \}为超平面,
如果对\forall x \in S_1,都有p^T x \ge \alpha,
对\forall x \in S_2,都有p^x \le \alpha,
则称超平面H分离集合S_1和S_2。Farkas定理
设A为m \times n矩阵,c为n维列向量,
则Ax \le 0, c^T x \gt 0有解,
\iff A^T y = c, y \ge 0无解。证:\implies
设存在y \ge 0,使得A^T y = c
则y^T A = c^T
设\overline{x}为Ax \le 0, c^T x \gt 0的一个解,
则有A \overline{x} \le 0, c^T \overline{x} \gt 0
\implies y^T A \overline{x} = c^T \overline{x} \gt 0 \quad (1)
y \ge 0, A \overline{x} \le 0 \implies y^T A \overline{x} \le 0与(1)矛盾。\impliedby
设A^T y = c, y \ge 0无解,令S = \{ z \mid z = A^T y, y \ge 0 \},则c \notin S
可以证明S为闭凸集,由凸集分离定理知,
\exists x \neq 0, \varepsilon \gt 0,使得对
\forall z \in S,有x^T c \ge \varepsilon + x^T z
\varepsilon \gt 0 \implies x^T c \gt x^T z
\implies c^T x \gt z^T x = y^T Ax
即对任意的y \ge 0,有c^T x \gt y^T Ax \quad (2)
令y = 0,得c^T x \gt 0
c^T x为一定数,y的分量可取任意大
\implies由(2),必有Ax \le 0
故非零向量x是Ax \le 0, c^T x \gt 0的解。
例:设A是m \times n矩阵,B是l \times n矩阵,c \in E^n,证明下列两个系统恰有一个有解:
系1 Ax \le 0, Bx = 0, c^T x \gt 0,对某些x \in E^n。
系2 A^T y + B^T z = c, y \ge 0,对某些y \in E^n和z \in E^l。证:Bx = 0等价于\left\{ \begin{array}{c} Bx \le 0 \\ Bx \ge 0 \end{array} \right.
故系统1有解,即
\begin{bmatrix} A \\ B \\ -B \end{bmatrix} x \le 0, c^T x \gt 0有解。
由Farkas定理知,
\begin{pmatrix} A^T & B^T & -B^T \end{pmatrix} \begin{bmatrix} y \\ u \\ v \end{bmatrix} = c, \begin{bmatrix} y \\ u \\ v \end{bmatrix} \ge 0无解。
令z = u - v,则
A^T y + B^T z = c, y \ge 0无解。
即系统2无解。反之,若系统2有解。即
\begin{pmatrix} A^T & B^T & -B^T \end{pmatrix} \begin{bmatrix} y \\ u \\ v \end{bmatrix} = c, \begin{bmatrix} y \\ u \\ v \end{bmatrix} \ge 0有解。
由Farkas定理,知
\begin{bmatrix} A \\ B \\ -B \end{bmatrix} x \le 0, c^T x \gt 0无解。
即Ax \le 0, Bx = 0, c^T x \gt 0无解,亦即系统1无解。
综上可得,两个系统恰有一个有解。Gordan定理
设A为m \times n矩阵,
则Ax \lt 0有解,
\iff A^T y = 0, y \ge 0 (y \neq 0)无解。证:\implies
设存在\overline{x},使得A \overline{x} \lt 0
若存在非零向量y \ge 0,使得A^T y = 0
则有y^T A = 0,\implies y^T A \overline{x} = 0
A \overline{x} \lt 0 \implies y的各分量不可能为非负数,与y \ge 0矛盾。\impliedby
(证等价命题)即若Ax \lt 0无解,则存在非零向量y \ge 0,使得A^T y = 0
设Ax \lt 0无解,令S_1 = \{ z \mid z = Ax, x \in E^n \}, S_2 = \{ z \mid z \lt 0 \}
Ax \lt 0无解 \implies S_1 \bigcap S_2 = \emptyset
由分离定理知,存在非零向量y,使得对\forall x \in E^n, \forall z \in S_2,有y^T Ax \ge y^T z \quad (1)
特别地,当x = 0时,有y^T z \le 0。
z \lt 0,它的分量可取任意负数 \implies y \ge 0
在(1)中令z \to 0,则对\forall x \in E^n,有
y^T Ax \ge 0 \quad (2)
令x = -A^T y,代入(2),得-y^T A A^T y \ge 0
即-\lVert A^T y \rVert \ge 0 \implies A^T y = 0
故存在非零向量y \ge 0,使得A^T y = 0