凸壳与线性可分

本文探讨了线性可分数据集与其正负实例点构成的凸壳不相交之间的关系,并通过数学证明阐述了两者的充分必要条件。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

本篇博客是对[1]中习题2.3的证明。首先给出凸壳与线性可分的定义:

凸壳

定义1:设集合SRn,是由Rn中的k个点所组成的集合,即S={x1,x2,,xk}。定义S的凸壳conv(S)为:

conv(S)={x=i=1kλixii=1kλi=1,λi0,i=1,2,,k}

注:看懂定义忽略该段,对这个定义进行一个小提示,首先凸壳是一个集合,对于所有可能的λi,i=1,2,,k只要满足ki=1λi=1,那么x=ki=1即为凸壳中的元素。凸壳可以用二维的图形可以表示如下
这里写图片描述

线性可分

定义2:给定一个数据集

T={(x1,y1),(x2,y2,,(xn,yn))}
其中xi=Rnyi={+1,1}i=1,2,,n,如果存在某个超平面S:
wx+b=0
能够讲数据集的正实例点和负实例点完全正确地划分到超平面的两侧,即对所有的正例点即yi=+1的实例i,有wxi+b>0,对所有的负实例点即yi=1的实例i,有wxi+b<0,则称数据集T为线性可分数据集;否则,称数据集T线性不可分。

=====================================================

定理

样本集线性可分的充分必要条件使正实例点集构成的凸壳与负实例点集所构成的凸壳互不相交。

必要性:线性可分->凸壳不相交

设数据集T中的正例点集为S+S+的凸壳为conv(S+),负实例点集为SS的凸壳为conv(S),若T是线性可分的,则存在一个超平面:

wx+b=0
能够将S+S完全分离。假设对于所有的正例点xi,有:

wxi+b=εi
易知εi>0,i=1,2,,|S+|。若conv(S+)conv(S)相交,即存在某个元素s,同时满足sconv(S+)sconv(S)。对于conv(S+)中的元素s+
ws+=wi=1kλixi=i=1kλi(εib)=i=1kλiεib
因此ws++b=ki=1λiεi>0,同理对于S+中的元素sws++b=ki=1λiεi<0,那么由于sconv(S+)sconv(S)ws+b=ki=1λiεi>0ws+b=ki=1λiεi<0明显推出矛盾,因此conv(S+)conv(S)必不相交。从而推出必要性。

充分性:凸壳不相交->线性可分

设数据集T中的正例点集为S+S+的凸壳为conv(S+),负实例点集为SS的凸壳为conv(S),且conv(S+)conv(S)不相交,定义两个点x1,x2的距离为

dist(x1,x2)=||x1x2||2=(x1x2)(x1x2)
定义conv(S+)conv(S)的距离为
dist(conv(S+),conv(S))=min||s+s||s+conv(S+),sconv(S)

x+conv(S+)xconv(S)dist(x+,x)=dist(conv(S+),conv(S))。则对于任意正例点xdist(x,x)dist(x+,x)。同理,对于所有的负例点xdist(x,x+)dist(x,x)。存在超平面
wx+b=0
其中
wb=x+x=x+x+xx2

则对于所有的正例点x(易知wx++b>0,因此若x+属于正例点,则令xx),
wx+b=(x+x)xx+x+xx2=x+xxxx+x+xx2=||xx||22||x+x||222=dist(x,x)2dist(x,x+)22

dist(x,x)dist(x,x+),则dist(x,x)dist(x,x+)dist(x,x+),那么dist(S+,S)<dist(x+,x)(注:证明过程见下方),推出矛盾。因此对所有的正例点,wx+b>0成立。同理,对所有的负例点,wx+b<0成立。至此,充分性得证。

补充:用反正法证明dist(x,x)>dist(x,x+)
证明:若dist(x,x)dist(x,x+),则存在t=(xx+)(xx+)||xx+||22,令x=tx+(1t)x+,则(xx)(x+x)=0。易知t1先证明0<t,我们可以将x,x+,x看作是空间中三个不同的点,三条边的长度分别为dist(x,x+),dist(x,x),dist(x,x+)有上文知dist(x,x+)dist(x,x)dist(x,x+)根据三角形的大边对应大角这一特性,很容易可以看出x+xx+x之间的夹角小于90度,因此t>0。那么dist(x,x)<dist(x+,x),有因为x必在conv(S+)内部,所以推出矛盾。

[1]:李航. 统计学习方法[M]. 清华大学出版社, 2012.
评论 7
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值