吴恩达机器学习 笔记七 支持向量机svm

这篇博客详细介绍了吴恩达机器学习课程中的支持向量机(SVM)。首先,解释了线性SVM的代价函数为何设计成特定形式,特别是为何当z=1和-1时代价为零。接着,探讨了最大化分类间距的直观理解,并阐述了优化目标。此外,还讨论了非线性SVM的概念,包括核函数的使用及其在SVM中的应用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1. 线性svm

1.1 代价函数

  吴恩达的svm课程中由logisitic回归讲起,将logistic回归中的代价函数转换成图中的形式。刚开始的时候我自己很疑惑这个地方:

  • 为什么代价函数要变成这个样子
  • 又为什么代价为零的地方要是z=11z=1和−1,不是z=2,3,4z=2,3,4……

  直到好好研究了一番svm的几何意义才明白这样做的意义,下面一一道来。

1.1.1 代价函数为什么要变成这个样子

代价函数

  我们假设二维平面,训练数据散点的坐标为x=(x1,x2)Tx=(x1,x2)T,我们要明确两个地方:

  • svm的目标是寻找一条支持最大分类间隔的直线θTx=0θTx=0
  • 我们不要忘记代价函数中的z=θTxz=θTx,这样,我们就可以将代价函数和几何意义联系起来了:
    • y=1y=1时,θTx>=1θTx>=1,也就是处于下图中的直线wTx+b=1wTx+b=1的上方,认为判断正确,代价为零。θTx<1θTx<1时,位于直线wTx+b=1wTx+b=1的下方,θTxθTx的值越小,离直线wTx+b=1wTx+b=1越远,代价越大。
    • y=1y=−1时,θTx<=1θTx<=−1,也就是处于下图中的直线wTx+b=1wTx+b=−1的下方,认为判断正确,代价为零。θTx>1θTx>−1时,位于直线wTx+b=1wTx+b=−1的上方,θTxθTx的值越大,离直线wTx+b=1wTx+b=−1越远,代价越大。

最大间隔

1.1.2 为什么代价为零的地方要是z=11z=1和−1

  简便起见,这里用wTx+bwTx+b表示直线。我们要寻找的wTx+b=11wTx+b=1或−1这两条直线是由数据所决定的,也就是说,在数据确定的情况下,这两条支持直线是确定的。那么显然ww是会随着wx+b=1,2,来调整的,所以z=1z=1不会影响我们的目标。

1.2 间距最大化的直观理解

  显然,蓝色的支持直线有一个安全间距,而绿色和红色支持直线几乎是没有的。
这里写图片描述

1.3 优化目标

minθCi=1m[y(i)cost1(θTx(i))+(1y(i))cost0(θTx(i))]+12i=1nθ2jminθC∑i=1m[y(i)cost1(θTx(i))+(1−y(i))cost0(θTx(i))]+12∑i=1nθj2
  • 如果y=1y=1,我们希望θTx>=1θTx>=1,不仅仅是>=0>=0
  • 如果y=0y=0,我们希望θTx<=1θTx<=−1,不仅仅是<=0<=0

这就相当于构建出了一个安全间距。因此,优化目标可以变换为

minθ12i=1n||θj||2minθ12∑i=1n||θj||2
θTx(i)>1,if y(i)=1θTx(i)<1,if y(i)=0θTx(i)>1,if y(i)=1θTx(i)<−1,if y(i)=0
根据向量内积的几何意义,此优化的目标,是寻找在x(i)x(i)上的投影满足条件的θθ中模值最小的那个θθ。并且,由前面的分析可知,θθ最小的时候安全间距是最大

2. 非线性svm

2.1 核函数

  核函数用来描述两个向量之间的相似度。高斯核函数的表达式如下

fguass=exp(||xl||22σ2)fguass=exp(−||x−l||22σ2)

2.2 核函数在svm中的应用

  在线性svm中,我们直接用θTx=0θTx=0作为分界直线。但是在非线性可分的情况下,我们就需要引入二次项了。在二维的情况下,我们可以人工将二次项都表示出来,但是在高维的时候仍然人工表示是不太现实的。
  我们注意到,在上面提到的核函数中,是含有经过映射的二次项的。并且,我们可以将训练样本的所有数据作为参考ll,即用与训练样本数据的相似度来刻画出我们所要寻找的非线性分界曲线
  采用核函数的非线性svm的代价函数表达式如下:

minθCi=1m[y(i)cost1(θTf(i))+(1y(i))cost0(θTf(i))]+12i=1nθj2
其中,f(i)j=fguass(x(i),x(j))fj(i)=fguass(x(i),x(j))

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值