SVM→7.SVM核变换

本文深入探讨了支持向量机(SVM)在处理非线性分类问题时的应用,特别是通过核变换将数据映射到高维空间以实现线性可分性的方法。详细介绍了核函数的作用,包括高斯核函数,并讨论了gamma参数对决策边界的影响。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

SVM→7.SVM核变换

《SVM→7 .SVM核变换》


  1. 对解线性分类问题, 线性分类支持向量机是一种非常有效的方法. 但是有时分类问题是非线性的, 这时可以使用非线性支持向量机  
paste-62139586838531.jpg
  1. 举例
    1. 假设有paste-62560493633539.jpgpaste-62637803044867.jpg,此时在3D空间不可线性划分,我们通过一个函数将数据映射到更高维的空间,比如说paste-63488206569475.jpgpaste-63565515980803.jpg,即将数据映射成了9维
    2. 我们知道在求解a*时会计算数据的内积
    3. 具体点,令paste-65103114272771.jpg,那么paste-65193308585987.jpgpaste-65270617997315.jpg
    4. 此时paste-65347927408643.jpg但是如果维数继续扩大的话,计算量就太大了
    5. 但是发现paste-65455301591043.jpgpaste-65532611002371.jpg,也就是说paste-65743064399875.jpg,所以使用核函数的好处是,可以在一个低维空间去完成高维度(或无限维度)样本内积的运算
    6. 设x和z都是n维的,将其映射到n2维,由于paste-326447579267075.jpg将j换成i是不对的,这样就没有xi*xj了(i!=j),因此可以只计算原始特征x和z内积的平方来节省时间
  2. 常用核函数
描述核函数和决策函数
  • 高斯核函数(径向基函数核 Radial basis function kernel)
高斯分布概率密度系数paste-150104812027907.jpg的目的就是为了使得paste-150177826471939.jpg,最重要的就是它的核

  1. 核函数paste-213661738074115.jpg值域是(0,1],e-x(x≥0)
  2. 决策函数paste-214267328462851.jpg
    1. paste-237799454277635.jpg,gamma参数可以看作是将单个训练集样本作为支持向量时的半径此支持向量到分割超平面的距离的反比,gamma越小,意味着距离分割超平面距离远的样本也可以作为支持向量即远的样本也会对超平面的确定产生影响;gamma越大,那么半径变小,意味着仅有距离近的样本可以作为支持向量对超平面产生影响。
    2. 数学解释:首先,明确概念:当两个样本距离很近时,K=1;当两个样本距离很远时,K=0。然后,当gamma很小时,即使x和z样本距离很远,K也接近1,因此真实距离远的样本也可看作离的很近,因此也需要考虑这些距离远的样本作为支持向量;当gamma大时,只有x和z样本距离很近,K才可以接近1,因此仅考虑距离近的样本作为支持向量。
    3. 当gamma越小,每个训练集有far reach的影响
      1. far reach决策边界
        paste-233311213453315.jpgpaste-244533962997763.jpg
    4. 当gamma越大,每个训练集仅有close reach的影响
      1. close reach决策边界
        paste-230665513598979.jpg
        圈中的影响可以忽略
        paste-246458108346371.jpg


data1data2
data1data2
data1data2





posted on 2018-10-08 08:37 LeisureZhao 阅读(...) 评论(...) 编辑 收藏

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值