凸集(Convex sets)

本文介绍了凸集和仿射集的基本概念,包括直线、线段、仿射维度及相对内部等,同时还探讨了超平面、半空间、欧几里得球和椭球等重要凸集的例子。

1 仿射集(affine sets)和凸集(convex sets)

1.1 直线(lines)和线段(line segments)

假如 x 1 ≠ x 2 x_1\neq x_2 x1=x2 R n {\bf R}^n Rn上的两点,点 y = θ x 1 + ( 1 − θ ) x 2 y=\theta x_1 +\left( 1-\theta\right)x_2 y=θx1+(1θ)x2(其中 θ ∈ R \theta \in \bf R θR),组成了穿过 x 1 x_1 x1 x 2 x_2 x2的直线。 0 0 0 1 1 1之间的 θ \theta θ值对应的点 y y y组成了 x 1 x_1 x1 x 2 x_2 x2之间的线段。
y y y的另一种表达形式为: y = x 2 + θ ( x 1 − x 2 ) y=x_2+\theta \left( x_1-x_2\right) y=x2+θ(x1x2)很容易理解, x 2 x_2 x2是基准点, θ ( x 1 − x 2 ) \theta \left( x_1-x_2\right) θ(x1x2)是在 ( x 1 − x 2 ) \left( x_1-x_2\right) (x1x2)方向上的延申,通过二维空间进行理解。

1.2 仿射集

一个集合 C ∈ R n C\in {\bf R}^n CRn,如果经过 C C C中任意两点的直线还是位于 C C C内,即对于任意的 x 1 , x 2 ∈ C x_1,x_2 \in C x1,x2C和任意 θ ∈ R \theta \in \bf R θR,有 θ x 1 + ( 1 − θ ) x 2 ∈ C \theta x_1 +\left( 1-\theta\right)x_2 \in C θx1+(1θ)x2C,那么这个集合 C C C就是仿射的。换句话说就是, C C C包括了 C C C中任意两点的 系数和为 1 1 1 线性组合。
指定点 θ 1 x 1 + . . . + θ k x k {\theta}_1 x_1+...+{\theta}_k x_k θ1x1+...+θkxk,其中 θ 1 + . . . + θ k = 1 {\theta}_1+...+{\theta}_k=1 θ1+...+θk=1,为点 x 1 , . . . , x k x_1,...,x_k x1,...,xk的仿射组合。仿射集的定义就是包括其中任意两点的仿射组合的集合,推广到“仿射集包括其中任意多点的每一个仿射组合”,简单证明如下:

可用归纳法严格证明。

线性方程组的解集 C = { x ∣ A x = b } C=\lbrace x \vert Ax=b\rbrace C={xAx=b}是一个仿射集,证明略。
事实上,每个仿射集都可以表示为线性方程组的解集。

某个集合 C ⊆ R n C\subseteq{\bf R}^n CRn里的点的所有仿射组合的集合被称为 C C C的仿射包(affine hull),表示为 aff C \text {\bf aff}\enspace C affC
aff C = { θ 1 x 1 + ⋯ + θ k x k   ∣   x 1 , … , x k ∈ C , θ 1 + ⋯ + θ k = 1 } . \text {\bf aff}\enspace C=\lbrace {\theta}_1x_1+\cdots+{\theta}_kx_k \: \vert \:x_1, \ldots, x_k \in C,{\theta}_1+ \cdots + {\theta}_k=1 \rbrace. affC={θ1x1++θkxkx1,,xkC,θ1++θk=1}.仿射包是包含 C C C的最小的仿射集,即如果 S S S是任意一个仿射集并且 C ⊆ S C\subseteq S CS,有 aff C ⊆ S \text {\bf aff}\enspace C \subseteq S affCS

1.3 仿射维度(affine dimension)和相对内部(relative interior)

定义一个集合 C C C的仿射维度为它的仿射包的维度。仿射维度与其他关于维度的定义不一样,比如, R 2 {\bf R}^2 R2上的单位圆的仿射包是整个 R 2 {\bf R}^2 R2,所以它的仿射维度为 2 2 2,但是大多数对维度的定义都认为 R 2 {\bf R}^2 R2上的单位圆是一维的。
定义一个集合 C C C相对内部 relint   C \text{\bf relint} \: C relintC,其中 relint   C ⊆ C ⊆ aff   C \text{\bf relint} \: C \subseteq C \subseteq \text{\bf aff} \: C relintCCaffC,并且 relint   C = { x ∈ C   ∣   B ( x , r ) ∩ aff   C ⊆ C , r > 0 } , \text{\bf relint} \: C = \lbrace x\in C \: \vert \: B\left( x,r\right) \cap \text{\bf aff} \: C \subseteq C, r>0 \rbrace, relintC={xCB(x,r)affCC,r>0},其中 B ( x , r ) = { y   ∣   ∥ y − x ∥ ≤ r } B\left( x,r\right)=\lbrace y \: \vert \: \lVert y -x \rVert \leq r\rbrace B(x,r)={yyxr}是圆心为 x x x,半径为 r r r范数球
定义集合 C C C的相对边界为 cl   C   \   relint   C = { x   ∣   x ∈ cl   C   and   x ∉ relint   C } \text {\bf cl} \: C \: \backslash \: \text {\bf relint} \: C=\lbrace x \: \vert \: x\in \text {\bf cl} \: C \: \text {and} \: x \notin \text{\bf relint} \: C\rbrace clC\relintC={xxclCandx/relintC},其中 cl   C \text {\bf cl} \: C clC C C C的闭包。

1.4 凸集

如果集合 C C C中任意两点之间的线段都位于 C C C内,即对于任意的 x 1 , x 2 ∈ C x_1,x_2\in C x1,x2C和任意 θ ( 0 ≤ θ ≤ 1 ) \theta \left( 0 \leq \theta \leq 1\right) θ(0θ1),有 θ x 1 + ( 1 − θ ) x 2 ∈ C \theta x_1+\left(1-\theta \right)x_2 \in C θx1+(1θ)x2C则称 C C C是凸的。
粗略地讲,如果集合中的任意一点都能被其他所有点沿着一条无障碍的直线路径看到,那么这个集合就是凸的,无障碍意味着路径上的每一点都位于该集合内。

相关定理1
若干个凸集的交集还是凸集;
若干个凸集的线性组合还是凸集;
每个仿射集都是凸的,因为它包含任意两个点之间的整条直线,因此也包含线段。

把形式为 θ 1 x 1 + . . . + θ k x k {\theta}_1 x_1+...+{\theta}_k x_k θ1x1+...+θkxk,其中 θ 1 + . . . + θ k = 1   and   θ i ≥ 0 , i = 1 , … , k {\theta}_1+...+{\theta}_k=1 \: \text{and} \:{\theta}_i \geq0,i=1,\dots,k θ1+...+θk=1andθi0,i=1,,k的点叫做点 x 1 , . . . , x k x_1,...,x_k x1,...,xk的一个凸组合

与仿射集一样,可以证明一个集合是凸的,当且仅当它包含它的任意点的每一个凸组合。
几个点的凸组合可以理解为它们的加权平均值, θ i {\theta}_i θi x i x_i xi在凸组合中的占比。
集合 C C C凸包(convex hull)是包含 C C C中的点的所有凸组合的集合,表示为 conv   C \text{\bf conv} \: C convC
conv   C = { θ 1 x 1 + . . . + θ k x k   ∣   x i ∈ C ,   θ i ≥ 0 ,   i = 1 , … , k ,   θ 1 + . . . + θ k = 1 } \text{\bf conv} \: C=\lbrace{\theta}_1 x_1+...+{\theta}_k x_k \: \vert \: x_i \in C,\:{\theta}_i \geq 0,\: i=1,\dots,k,\: {\theta}_1+...+{\theta}_k=1\rbrace convC={θ1x1+...+θkxkxiC,θi0,i=1,,k,θ1+...+θk=1}
顾名思义,凸包 conv   C \text{\bf conv} \: C convC总是凸的,它是包括 C C C的最小凸集,即如果 B B B是包括 C C C的任意一个凸集,则 conv   C ⊆ B \text{\bf conv} \: C \subseteq B convCB

凸组合的概念可以推广到包括无穷和、积分,以及最一般形式的概率分布。在这里插入图片描述

1.5 锥(Cones)

如果对每个 x ∈ C x \in C xC θ ≥ 0 \theta \geq0 θ0,有 θ x ∈ C \theta x \in C θxC,则称集合 C C C是一个或者是非负齐次性(nonnegative homogeneous)的。
如果集合 C C C既是凸的,又是一个锥,则称 C C C是一个凸锥(convex cone),即对于任意 x 1 , x 2 ∈ C x_1,x_2 \in C x1,x2C θ 1 , θ 2 ≥ 0 {\theta}_1,{\theta}_2 \geq0 θ1,θ20,有 θ 1 x 1 + θ 2 x 2 ∈ C . {\theta}_1x_1+{\theta}_2x_2 \in C. θ1x1+θ2x2C.在这里插入图片描述
一个形如 θ 1 x 1 + ⋯ + θ k x k {\theta}_1x_1+\cdots+{\theta}_kx_k θ1x1++θkxk θ 1 , … , θ k ≥ 0 {\theta}_1,\ldots,{\theta}_k \geq0 θ1,,θk0)的点叫做点 x 1 , … , x k x_1,\ldots,x_k x1,,xk锥组合(或非负线性组合)。
凸锥 C C C里面的点的每一个锥组合都在 C C C里面。一个集合是凸锥,当且仅当它包含它的元素的所有锥组合。
像凸组合一样,锥组合的想法可以推广到无穷和积分
集合 C C C锥包 C C C中点的所有锥组合的集合,即 { θ 1 x 1 + ⋯ + θ k x k   ∣   x i ∈ C ,   θ i ≥ 0 ,   i = 1 , … , k } , \lbrace {\theta}_1x_1+\cdots+{\theta}_kx_k \: \vert \: x_i \in C,\: {\theta}_i \geq 0,\:i=1,\ldots,k\rbrace, {θ1x1++θkxkxiC,θi0,i=1,,k},也是包括 C C C的最小凸锥。
在这里插入图片描述

2、一些重要的(凸集)例子

  • 空集 ϕ \phi ϕ、任意单点集 { x 0 } \lbrace x_0 \rbrace {x0}和整个空间 R n {\bf R}^n Rn都是 R n {\bf R}^n Rn的仿射(因此是凸的)子集。
  • 任意直线(line)是仿射的。一条穿过零点的直线是一个子空间,因此也是一个凸锥。
  • 一条线段是凸的,但不是仿射的(但特殊的线段:一个点,是仿射的)。
  • 一条射线,形式为 { x 0 + θ v   ∣   θ ≥ 0 } ,   v ≠ 0 \lbrace x_0 +\theta v\: \vert \: \theta \geq 0 \rbrace,\:v\neq0 {x0+θvθ0},v=0,是凸的,但不是仿射的。
  • 任何子空间(subspace)都是仿射的,也是凸锥(因此也是凸的)。

2.1 超平面(Hyperplanes)和半空间(halfspaces)

一个超平面是一个形式为 { x   ∣   a T x = b } \lbrace x\:\vert\: a^Tx=b\rbrace {xaTx=b}的集合,其中 a ∈ R n , a ≠ 0 , b ∈ R a\in{\bf R}^n,a\neq 0,b\in \bf R aRn,a=0,bR。可以理解为法向量为 a a a的超平面,即
{ x   ∣   a T ( x − x 0 ) = 0 } , \lbrace x\:\vert\: a^T\left( x-x_0\right)=0\rbrace, {xaT(xx0)=0},其中 x 0 x_0 x0是超平面上任意一点(即满足 a T x 0 = b a^Tx_0=b aTx0=b的点)。
也可以表示为:
{ x   ∣   a T ( x − x 0 ) = 0 } = x 0 + a ⊥ , \lbrace x\:\vert\: a^T\left( x-x_0\right)=0\rbrace=x_0+a^{\bot}, {xaT(xx0)=0}=x0+a,其中 a ⊥ a^{\bot} a表示 a a a的正交补(orthogonal complement),即与 a a a正交的所有向量的集合:
a ⊥ = { v   ∣   a T v = 0 } . a^{\bot}=\lbrace v\:\vert\: a^Tv=0\rbrace. a={vaTv=0}.
在这里插入图片描述
一个超平面把空间 R n {\bf R}^n Rn分成两个半空间(halfspace),一个(封闭的)半空间是形式为 { x   ∣   a T x ≤ b } , a ≠ 0 \lbrace x\:\vert\: a^Tx\leq b\rbrace,a\neq0 {xaTxb},a=0的集合,它是凸的,但不是仿射的。
在这里插入图片描述
半空间由 x 0 x_0 x0加上和向量 a a a夹角为钝(直)角的向量组成:
{ x   ∣   a T ( x − x 0 ) ≤ 0 } , \lbrace x\:\vert\: a^T\left( x-x_0\right)\leq0\rbrace, {xaT(xx0)0},
在这里插入图片描述
开半空间(open halfspace): { x   ∣   a T x < b } , a ≠ 0. \lbrace x\:\vert\: a^Tx<b\rbrace,a\neq0. {xaTx<b},a=0.

2.2 欧几里得球(Euclidean balls)和椭球(ellipsoids)

R n {\bf R}^n Rn上的一个欧几里得球(或者说一个球)是形式如下的集合:
B ( x c , r ) = { x   ∣   ∥ x − x c ∥ 2 ≤ r } = { x   ∣   ( x − x c ) T ( x − x c ) ≤ r 2 } , B \left( x_c,r\right)=\lbrace x \: \vert \: \lVert x-x_c \rVert_2 \leq r \rbrace=\lbrace x \: \vert \: {\left( x-x_c\right)}^T\left( x-x_c\right) \leq r^2 \rbrace, B(xc,r)={xxxc2r}={x(xxc)T(xxc)r2},其中 r > 0 r>0 r>0 ∥ ⋅ ∥ 2 \lVert \cdot \rVert_2 2表示欧式范数, ∥ u ∥ 2 = ( u T u ) 1 / 2 \lVert u\rVert_2={\left( u^Tu\right)}^{1/2} u2=(uTu)1/2
在这里插入图片描述
这里用到了范数的性质2
椭球体


  1. 有关定理的证明 ↩︎

  2. 范数 ↩︎

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值