1、支持向量回归的原始问题
先来看看SVM线性支持向量机(软间隔)的原始问题:
其中ξi是松弛变量,但它实际上是hinge(合页)损失函数,所以ξi也作为对应的点(xi, yi)的损失,如下图所示:
当点(xi, yi)位于间隔面上或者间隔面之外(这两种都是正确分类的情况)则ξi=0,若点(xi, yi)位于分割面上或者位于间隔面与分割面之间(正确分类)或者位于间隔面与分割面之间(错误分类),这三种情况都是有损失的,损失为 1 - yi(w·xi + b)。
SVM线性支持向量机(软间隔)的原始问题等价于如下问题:
好了现在来看SVR的原始问题:
如上图所示,SVR需要学到一个最大间隔(几何间隔)的回归面或回归线,ε代表精度,在2ε间隔之内的点和间隔面上的点离回归面最近,所以认为这些点的预测结果比较可靠,是没有损失的,而2ε间隔之外的点离回归面较远,所以认为这些点的预测结果不太可靠,是有损失的。而敏感度损失函数刚好就能用来计算每个点的损失,如下图所示:
其中w·xi+b代表预测值,yi是实际值,|w·xi+b - yi|表示误差绝对值,如果点(xi, yi)的预测误差绝对值小于等于ε,则ξi=0,ξi代表损失;如果点(xi, yi)的预测误差绝对值大于ε,则ξi= |w·xi+b - yi| - ε。
综上所述得出SVR的原始约束问题:
其中约束条件的意义就是让所有的点(xi, yi)都满足敏感度损失函数,也就是让 ξi 能足够代替点(x