线性可分和线性不可分
线性可分指的是可以用一个线性函数将两类样本分开(注意这里是线性函数),比如在二维空间中的直线,三位空间中的平面以及高维空间中的超平面。这里指的可分是没有一丝误差的分开,线性不可分指的就是部分样本用线性分类面划分时会产生分类错误的现象。

线性模型
乘法式子中自变量x前的系数w,如果一个w只影响一个x,那么这个模型就是线性模型,如y=w0+w1∗xy=w_0 + w_1*xy=w0+w1∗x
当需要拟合y=w0+w1∗x+w2∗x2y=w_0+w_1*x+w_2*x^2y=w0+w1∗x+w2∗x2时,可将x2x^2x2替换为zzz,即利用升维,将一个多项式回归模型变为线性回归模型。
判断数据是否线性可分
凸包就是一个刚好包住了所有的数据的凸的闭合曲线(曲面)。

检查凸包(convex hull)是否相交,可以作为判断数据是否线性可分的依据。
-
用quickhull算法来找到数据的凸包
-
sweepline算法判断凸包边缘是否有相交
两个步骤的复杂度都是O(nlogn)
其中quickhull已经在软件包qhull(http://www.qhull.org/)实现了。
博客介绍了线性可分和线性不可分的概念,线性可分指能用线性函数无误差分开两类样本,线性不可分则会产生分类错误。还阐述了线性模型,可通过升维将多项式回归模型变为线性回归模型。最后介绍用凸包判断数据是否线性可分,以及相关算法和实现软件包。
5278

被折叠的 条评论
为什么被折叠?



