支持向量机行人检测技术详解
1. 线性分类的困境与解决思路
在分类任务中,若使用直线进行分类,当我们试图正确分类当前误分类的点时,往往会导致原本正确分类的点被误分类,形成一个恶性循环。为了提升分类性能,我们需要从直线决策边界转向更复杂的决策边界。
当数据无法用线性决策边界进行最优划分时,我们称这些数据是非线性可分的。处理非线性可分数据的基本思路是创建原始特征的非线性组合,即将数据投影到更高维的空间(例如从二维到三维),使数据在该空间中变得线性可分。在$n$维空间中,线性决策边界被称为超平面。例如,在6维特征空间中,决策边界是一个5维超平面;在3维特征空间中,是一个普通的2维平面;在2维空间中,则是一条直线。
然而,这种映射方法在高维空间中存在实际问题,因为在不同维度之间进行数学投影会增加大量额外项。这时,核技巧就派上用场了。
2. 核技巧的原理与应用
核技巧的核心在于,为了确定高维空间中决策超平面的斜率和方向,我们需要将所有特征值与适当的权重值相乘并求和。特征空间的维度越高,计算量就越大。但数学家们发现,支持向量机(SVM)在训练和测试过程中无需显式地在高维空间中工作。优化问题仅使用训练示例来计算两个特征之间的成对点积,并且存在一种技巧可以在不将特征显式转换到高维空间的情况下计算这种积,能够实现这种巧妙计算的函数被称为核函数。
径向基函数(RBFs)是一类常见的核函数,其值仅取决于与参考点的距离。例如,$f(r) = 1/r$或$f(r) = 1/r^2$就是RBF的例子,更常见的是高斯函数(也称为钟形曲线)。通过调整高斯函数的标准差,可以创建大量复杂的决策边界,尤其是在高维空间中。
OpenCV
超级会员免费看
订阅专栏 解锁全文
9398

被折叠的 条评论
为什么被折叠?



