凸集(Convex sets)
1 仿射集(affine sets)和凸集(convex sets)
1.1 直线(lines)和线段(line segments)
假如
x
1
≠
x
2
x_1\neq x_2
x1=x2是
R
n
{\bf R}^n
Rn上的两点,点
y
=
θ
x
1
+
(
1
−
θ
)
x
2
y=\theta x_1 +\left( 1-\theta\right)x_2
y=θx1+(1−θ)x2(其中
θ
∈
R
\theta \in \bf R
θ∈R),组成了穿过
x
1
x_1
x1和
x
2
x_2
x2的直线。
0
0
0到
1
1
1之间的
θ
\theta
θ值对应的点
y
y
y组成了
x
1
x_1
x1和
x
2
x_2
x2之间的线段。
y
y
y的另一种表达形式为:
y
=
x
2
+
θ
(
x
1
−
x
2
)
y=x_2+\theta \left( x_1-x_2\right)
y=x2+θ(x1−x2)很容易理解,
x
2
x_2
x2是基准点,
θ
(
x
1
−
x
2
)
\theta \left( x_1-x_2\right)
θ(x1−x2)是在
(
x
1
−
x
2
)
\left( x_1-x_2\right)
(x1−x2)方向上的延申,通过二维空间进行理解。
1.2 仿射集
一个集合
C
∈
R
n
C\in {\bf R}^n
C∈Rn,如果经过
C
C
C中任意两点的直线还是位于
C
C
C内,即对于任意的
x
1
,
x
2
∈
C
x_1,x_2 \in C
x1,x2∈C和任意
θ
∈
R
\theta \in \bf R
θ∈R,有
θ
x
1
+
(
1
−
θ
)
x
2
∈
C
\theta x_1 +\left( 1-\theta\right)x_2 \in C
θx1+(1−θ)x2∈C,那么这个集合
C
C
C就是仿射的。换句话说就是,
C
C
C包括了
C
C
C中任意两点的 系数和为
1
1
1的 线性组合。
指定点
θ
1
x
1
+
.
.
.
+
θ
k
x
k
{\theta}_1 x_1+...+{\theta}_k x_k
θ1x1+...+θkxk,其中
θ
1
+
.
.
.
+
θ
k
=
1
{\theta}_1+...+{\theta}_k=1
θ1+...+θk=1,为点
x
1
,
.
.
.
,
x
k
x_1,...,x_k
x1,...,xk的仿射组合。仿射集的定义就是包括其中任意两点的仿射组合的集合,推广到“仿射集包括其中任意多点的每一个仿射组合”,简单证明如下:
可用归纳法严格证明。
线性方程组的解集
C
=
{
x
∣
A
x
=
b
}
C=\lbrace x \vert Ax=b\rbrace
C={x∣Ax=b}是一个仿射集,证明略。
事实上,每个仿射集都可以表示为线性方程组的解集。
某个集合
C
⊆
R
n
C\subseteq{\bf R}^n
C⊆Rn里的点的所有仿射组合的集合被称为
C
C
C的仿射包(affine hull),表示为
aff
C
\text {\bf aff}\enspace C
affC:
aff
C
=
{
θ
1
x
1
+
⋯
+
θ
k
x
k
∣
x
1
,
…
,
x
k
∈
C
,
θ
1
+
⋯
+
θ
k
=
1
}
.
\text {\bf aff}\enspace C=\lbrace {\theta}_1x_1+\cdots+{\theta}_kx_k \: \vert \:x_1, \ldots, x_k \in C,{\theta}_1+ \cdots + {\theta}_k=1 \rbrace.
affC={θ1x1+⋯+θkxk∣x1,…,xk∈C,θ1+⋯+θk=1}.仿射包是包含
C
C
C的最小的仿射集,即如果
S
S
S是任意一个仿射集并且
C
⊆
S
C\subseteq S
C⊆S,有
aff
C
⊆
S
\text {\bf aff}\enspace C \subseteq S
affC⊆S。
1.3 仿射维度(affine dimension)和相对内部(relative interior)
定义一个集合
C
C
C的仿射维度为它的仿射包的维度。仿射维度与其他关于维度的定义不一样,比如,
R
2
{\bf R}^2
R2上的单位圆的仿射包是整个
R
2
{\bf R}^2
R2,所以它的仿射维度为
2
2
2,但是大多数对维度的定义都认为
R
2
{\bf R}^2
R2上的单位圆是一维的。
定义一个集合
C
C
C的相对内部为
relint
C
\text{\bf relint} \: C
relintC,其中
relint
C
⊆
C
⊆
aff
C
\text{\bf relint} \: C \subseteq C \subseteq \text{\bf aff} \: C
relintC⊆C⊆affC,并且
relint
C
=
{
x
∈
C
∣
B
(
x
,
r
)
∩
aff
C
⊆
C
,
r
>
0
}
,
\text{\bf relint} \: C = \lbrace x\in C \: \vert \: B\left( x,r\right) \cap \text{\bf aff} \: C \subseteq C, r>0 \rbrace,
relintC={x∈C∣B(x,r)∩affC⊆C,r>0},其中
B
(
x
,
r
)
=
{
y
∣
∥
y
−
x
∥
≤
r
}
B\left( x,r\right)=\lbrace y \: \vert \: \lVert y -x \rVert \leq r\rbrace
B(x,r)={y∣∥y−x∥≤r}是圆心为
x
x
x,半径为
r
r
r的范数球。
定义集合
C
C
C的相对边界为
cl
C
\
relint
C
=
{
x
∣
x
∈
cl
C
and
x
∉
relint
C
}
\text {\bf cl} \: C \: \backslash \: \text {\bf relint} \: C=\lbrace x \: \vert \: x\in \text {\bf cl} \: C \: \text {and} \: x \notin \text{\bf relint} \: C\rbrace
clC\relintC={x∣x∈clCandx∈/relintC},其中
cl
C
\text {\bf cl} \: C
clC为
C
C
C的闭包。
1.4 凸集
如果集合
C
C
C中任意两点之间的线段都位于
C
C
C内,即对于任意的
x
1
,
x
2
∈
C
x_1,x_2\in C
x1,x2∈C和任意
θ
(
0
≤
θ
≤
1
)
\theta \left( 0 \leq \theta \leq 1\right)
θ(0≤θ≤1),有
θ
x
1
+
(
1
−
θ
)
x
2
∈
C
\theta x_1+\left(1-\theta \right)x_2 \in C
θx1+(1−θ)x2∈C则称
C
C
C是凸的。
粗略地讲,如果集合中的任意一点都能被其他所有点沿着一条无障碍的直线路径看到,那么这个集合就是凸的,无障碍意味着路径上的每一点都位于该集合内。
相关定理1:
若干个凸集的交集还是凸集;
若干个凸集的线性组合还是凸集;
每个仿射集都是凸的,因为它包含任意两个点之间的整条直线,因此也包含线段。
把形式为 θ 1 x 1 + . . . + θ k x k {\theta}_1 x_1+...+{\theta}_k x_k θ1x1+...+θkxk,其中 θ 1 + . . . + θ k = 1 and θ i ≥ 0 , i = 1 , … , k {\theta}_1+...+{\theta}_k=1 \: \text{and} \:{\theta}_i \geq0,i=1,\dots,k θ1+...+θk=1andθi≥0,i=1,…,k的点叫做点 x 1 , . . . , x k x_1,...,x_k x1,...,xk的一个凸组合。
与仿射集一样,可以证明一个集合是凸的,当且仅当它包含它的任意点的每一个凸组合。
几个点的凸组合可以理解为它们的加权平均值,
θ
i
{\theta}_i
θi为
x
i
x_i
xi在凸组合中的占比。
集合
C
C
C的凸包(convex hull)是包含
C
C
C中的点的所有凸组合的集合,表示为
conv
C
\text{\bf conv} \: C
convC:
conv
C
=
{
θ
1
x
1
+
.
.
.
+
θ
k
x
k
∣
x
i
∈
C
,
θ
i
≥
0
,
i
=
1
,
…
,
k
,
θ
1
+
.
.
.
+
θ
k
=
1
}
\text{\bf conv} \: C=\lbrace{\theta}_1 x_1+...+{\theta}_k x_k \: \vert \: x_i \in C,\:{\theta}_i \geq 0,\: i=1,\dots,k,\: {\theta}_1+...+{\theta}_k=1\rbrace
convC={θ1x1+...+θkxk∣xi∈C,θi≥0,i=1,…,k,θ1+...+θk=1}
顾名思义,凸包
conv
C
\text{\bf conv} \: C
convC总是凸的,它是包括
C
C
C的最小凸集,即如果
B
B
B是包括
C
C
C的任意一个凸集,则
conv
C
⊆
B
\text{\bf conv} \: C \subseteq B
convC⊆B。
凸组合的概念可以推广到包括无穷和、积分,以及最一般形式的概率分布。
1.5 锥(Cones)
如果对每个
x
∈
C
x \in C
x∈C和
θ
≥
0
\theta \geq0
θ≥0,有
θ
x
∈
C
\theta x \in C
θx∈C,则称集合
C
C
C是一个锥或者是非负齐次性(nonnegative homogeneous)的。
如果集合
C
C
C既是凸的,又是一个锥,则称
C
C
C是一个凸锥(convex cone),即对于任意
x
1
,
x
2
∈
C
x_1,x_2 \in C
x1,x2∈C和
θ
1
,
θ
2
≥
0
{\theta}_1,{\theta}_2 \geq0
θ1,θ2≥0,有
θ
1
x
1
+
θ
2
x
2
∈
C
.
{\theta}_1x_1+{\theta}_2x_2 \in C.
θ1x1+θ2x2∈C.
一个形如
θ
1
x
1
+
⋯
+
θ
k
x
k
{\theta}_1x_1+\cdots+{\theta}_kx_k
θ1x1+⋯+θkxk(
θ
1
,
…
,
θ
k
≥
0
{\theta}_1,\ldots,{\theta}_k \geq0
θ1,…,θk≥0)的点叫做点
x
1
,
…
,
x
k
x_1,\ldots,x_k
x1,…,xk的锥组合(或非负线性组合)。
凸锥
C
C
C里面的点的每一个锥组合都在
C
C
C里面。一个集合是凸锥,当且仅当它包含它的元素的所有锥组合。
像凸组合一样,锥组合的想法可以推广到无穷和和积分。
集合
C
C
C的锥包是
C
C
C中点的所有锥组合的集合,即
{
θ
1
x
1
+
⋯
+
θ
k
x
k
∣
x
i
∈
C
,
θ
i
≥
0
,
i
=
1
,
…
,
k
}
,
\lbrace {\theta}_1x_1+\cdots+{\theta}_kx_k \: \vert \: x_i \in C,\: {\theta}_i \geq 0,\:i=1,\ldots,k\rbrace,
{θ1x1+⋯+θkxk∣xi∈C,θi≥0,i=1,…,k},也是包括
C
C
C的最小凸锥。

2、一些重要的(凸集)例子
- 空集 ϕ \phi ϕ、任意单点集 { x 0 } \lbrace x_0 \rbrace {x0}和整个空间 R n {\bf R}^n Rn都是 R n {\bf R}^n Rn的仿射(因此是凸的)子集。
- 任意直线(line)是仿射的。一条穿过零点的直线是一个子空间,因此也是一个凸锥。
- 一条线段是凸的,但不是仿射的(但特殊的线段:一个点,是仿射的)。
- 一条射线,形式为 { x 0 + θ v ∣ θ ≥ 0 } , v ≠ 0 \lbrace x_0 +\theta v\: \vert \: \theta \geq 0 \rbrace,\:v\neq0 {x0+θv∣θ≥0},v=0,是凸的,但不是仿射的。
- 任何子空间(subspace)都是仿射的,也是凸锥(因此也是凸的)。
2.1 超平面(Hyperplanes)和半空间(halfspaces)
一个超平面是一个形式为
{
x
∣
a
T
x
=
b
}
\lbrace x\:\vert\: a^Tx=b\rbrace
{x∣aTx=b}的集合,其中
a
∈
R
n
,
a
≠
0
,
b
∈
R
a\in{\bf R}^n,a\neq 0,b\in \bf R
a∈Rn,a=0,b∈R。可以理解为法向量为
a
a
a的超平面,即
{
x
∣
a
T
(
x
−
x
0
)
=
0
}
,
\lbrace x\:\vert\: a^T\left( x-x_0\right)=0\rbrace,
{x∣aT(x−x0)=0},其中
x
0
x_0
x0是超平面上任意一点(即满足
a
T
x
0
=
b
a^Tx_0=b
aTx0=b的点)。
也可以表示为:
{
x
∣
a
T
(
x
−
x
0
)
=
0
}
=
x
0
+
a
⊥
,
\lbrace x\:\vert\: a^T\left( x-x_0\right)=0\rbrace=x_0+a^{\bot},
{x∣aT(x−x0)=0}=x0+a⊥,其中
a
⊥
a^{\bot}
a⊥表示
a
a
a的正交补(orthogonal complement),即与
a
a
a正交的所有向量的集合:
a
⊥
=
{
v
∣
a
T
v
=
0
}
.
a^{\bot}=\lbrace v\:\vert\: a^Tv=0\rbrace.
a⊥={v∣aTv=0}.

一个超平面把空间
R
n
{\bf R}^n
Rn分成两个半空间(halfspace),一个(封闭的)半空间是形式为
{
x
∣
a
T
x
≤
b
}
,
a
≠
0
\lbrace x\:\vert\: a^Tx\leq b\rbrace,a\neq0
{x∣aTx≤b},a=0的集合,它是凸的,但不是仿射的。

半空间由
x
0
x_0
x0加上和向量
a
a
a夹角为钝(直)角的向量组成:
{
x
∣
a
T
(
x
−
x
0
)
≤
0
}
,
\lbrace x\:\vert\: a^T\left( x-x_0\right)\leq0\rbrace,
{x∣aT(x−x0)≤0},

开半空间(open halfspace):
{
x
∣
a
T
x
<
b
}
,
a
≠
0.
\lbrace x\:\vert\: a^Tx<b\rbrace,a\neq0.
{x∣aTx<b},a=0.
2.2 欧几里得球(Euclidean balls)和椭球(ellipsoids)
R
n
{\bf R}^n
Rn上的一个欧几里得球(或者说一个球)是形式如下的集合:
B
(
x
c
,
r
)
=
{
x
∣
∥
x
−
x
c
∥
2
≤
r
}
=
{
x
∣
(
x
−
x
c
)
T
(
x
−
x
c
)
≤
r
2
}
,
B \left( x_c,r\right)=\lbrace x \: \vert \: \lVert x-x_c \rVert_2 \leq r \rbrace=\lbrace x \: \vert \: {\left( x-x_c\right)}^T\left( x-x_c\right) \leq r^2 \rbrace,
B(xc,r)={x∣∥x−xc∥2≤r}={x∣(x−xc)T(x−xc)≤r2},其中
r
>
0
r>0
r>0,
∥
⋅
∥
2
\lVert \cdot \rVert_2
∥⋅∥2表示欧式范数,
∥
u
∥
2
=
(
u
T
u
)
1
/
2
\lVert u\rVert_2={\left( u^Tu\right)}^{1/2}
∥u∥2=(uTu)1/2。

这里用到了范数的性质2。
椭球体:
本文介绍了凸集和仿射集的基本概念,包括直线、线段、仿射维度及相对内部等,同时还探讨了超平面、半空间、欧几里得球和椭球等重要凸集的例子。
3193

被折叠的 条评论
为什么被折叠?



