第十三章 支持向量机support vector machines SVM

本文深入探讨了支持向量机(SVM)的优化目标及其作为大间距分类器的直观理解与数学原理。同时,详细介绍了核函数的概念,包括高斯核函数的应用,以及如何通过选择landmark和调整参数来优化SVM的性能。

课时101 优化目标
在这里插入图片描述
逻辑回归中,记z=θTx。 y=1时,希望z远大于0,代价函数的值由左图的式子决定,可以看出z很大时代价很小。我们将玫红色的线记做cost1(z)。y=0时,希望z远小于0,代价函数的值由右图的式子决定,可以看出z很小时代价很小。我们将玫红色的线记做cost0(z)。
优化目标:
在这里插入图片描述
把负号移到了括号里面去了。去掉1/m不影响取最小值的θ值,这里去掉这个常数。把λ变化一下移到前一项,同样在相同的θ处取最值。就得到了最终的优化目标。
与逻辑回归还有一处不同,SVM支持向量机不会输出概率,而是通过学习得出θ后直接预测hθ(x)的结果是0还是1。
在这里插入图片描述
课时102 直观上对大间隔的理解 large margin intuition
在这里插入图片描述
这相当于为SVM设置了一个安全间距。当C很大时,我们很希望第一项为0,这时优化目标就变成了在这里插入图片描述结果是:
在这里插入图片描述
黑线和蓝线的间距就叫margin间距,因此SVM也叫大间距分类器large margin classifier。为什么会这样下一节讲。
现在的大间距分类器是在C很大的情况下实现的,当只使用大间距分类器时你的学习算法对异常点会很敏感。
让C小一点就不会太敏感,可以得到更正确的结果。

课时103 大间隔分类器的数学原理 (optional)从数学上解释为什么C很大时SVM会是大间距分类器
向量内积:在这里插入图片描述uTv=vTu
算法一:直接算。uTv=u1v1+u2v2.
算法二:投影法。p是将向量v投影到u上的长度(uv夹角大于90度时p就是负的)。内积就是p乘以向量u的长度(范数)。uTv=p·||u||.
见下图,设n=2,有x1 x2, 有θ0 θ1 θ2,设θ0=0。
在这里插入图片描述
见下图,由代数知识可知boundary和θ垂直。如果不是大间距地分类,如图左,正样本θTx(i)>=1,x的投影p会很短,p小就要求||θ||很大。负样本θTx(i)<=-1,p也短,p是负数值小,要求||θ||很大。与找到使得θ的范式最小的优化目标矛盾了。因此,SVM会尽力找到大间距。
在这里插入图片描述

课时104 核函数1 kernels I
在这里插入图片描述
f表示特征。
定义新特征的方法:
在这里插入图片描述
通过similarity函数表示给定的x与选择的l的接近度,以此来定义新的特征,函数叫核函数(高斯核函数)。
在这里插入图片描述
当x与l1接近时,根据核函数的计算式看出f1接近于1;当x于l1离得远时,根据核函数看出f1接近于0。
在这里插入图片描述
当σ越大,f1函数越平缓。σ越小函数越尖锐。
在这里插入图片描述
有了θ,f,便可预测最终结果。

课时105 核函数2 kernels II
选择landmark的方法:
直接将样本点们作为landmark:也就是有m个landmark
在这里插入图片描述
在这里插入图片描述
用sim简称similarity函数。对一个给定的x(i)对应的f1(i)到fm(i),其中有fi(i)就是将这个x(i)点作为了landmark,距离为0,fi(i)为1。f矩阵如上图红色圈圈里面。
在这里插入图片描述
最小化的方法可以直接调用包(如liblinear, libsvm, …),不用自己写。但是需要选择参数C和kernel方程。具体见下一节。

选择参数:
大C类似于小λ。
σ2 大σ对应函数平滑,高偏差,欠拟合。
在这里插入图片描述

课时106 使用SVM
在这里插入图片描述
no kernel/“linear kernel” 没有核参数的函数,假设函数实际上是线性的,适合n大m小,无法拟合比较复杂的函数的时候。
高斯gaussian kernel是最常见的核函数,需要选择σ²,写出函数,提前做feature scaling.
在这里插入图片描述
不是所有的相似函数都可以成为有效的核函数,需要满足莫塞尔定理Mercer’s Theroem。 还有一些不常用的核函数:
在这里插入图片描述
多类分类:
很多SVM的包已经内置了多分类的函数。或者使用one-vs-all的方法。
在这里插入图片描述
逻辑回归和SVM如何选择:
在这里插入图片描述

乐播投屏是一款简单好用、功能强大的专业投屏软件,支持手机投屏电视、手机投电脑、电脑投电视等多种投屏方式。 多端兼容与跨网投屏:支持手机、平板、电脑等多种设备之间的自由组合投屏,且无需连接 WiFi,通过跨屏技术打破网络限制,扫一扫即可投屏。 广泛的应用支持:支持 10000+APP 投屏,包括综合视频、网盘与浏览器、美韩剧、斗鱼、虎牙等直播平台,还能将央视、湖南卫视等各大卫视的直播内容一键投屏。 高清流畅投屏体验:腾讯独家智能音画调校技术,支持 4K 高清画质、240Hz 超高帧率,低延迟不卡顿,能为用户提供更高清、流畅的视觉享受。 会议办公功能强大:拥有全球唯一的 “超级投屏空间”,扫码即投,无需安装。支持多人共享投屏、远程协作批注,PPT、Excel、视频等文件都能流畅展示,还具备企业级安全加密,保障会议资料不泄露。 多人互动功能:支持多人投屏,邀请好友加入投屏互动,远程也可加入。同时具备一屏多显、语音互动功能,支持多人连麦,实时语音交流。 文件支持全面:支持 PPT、PDF、Word、Excel 等办公文件,以及视频、图片等多种类型文件的投屏,还支持网盘直投,无需下载和转格式。 特色功能丰富:投屏时可同步录制投屏画面,部分版本还支持通过触控屏或电视端外接鼠标反控电脑,以及在投屏过程中用画笔实时标注等功能。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值