超平面 之前学习过单层感知机。对超平面有一个感性的认识。 笼统的说超平面其实就是nnn维空间的n−1n-1n−1维子空间 类似于二维空间的直线, 三维空间的平面。 为了 导出超平面的定义,其实我们需要从新看待直线的定义. 将方向的影响考虑到直线中。 给定一个二维向量(A,B)(A,B)(A,B),所有垂直于此向量的点都满足:Ax+By=0Ax+By=0Ax+By=0 这是因为,垂直后,向量内积恒为000. 法方向(A,B)(A,B)(A,B)和平移CCC,可以表示二维空间所有直线: Ax+By+C=0Ax+By+C=0Ax+By+C=0 可以写成(x,y)(A,B)T+C=0(x,y)(A,B)^T+C=0(x,y)(A,B)T+C=0 对于nnn维空间,给定平面法向量www,令所有满足[w,x]=0[w,x]=0[w,x]=0的向量(点)是nnn维空间过原点的超平面。 那么nnn为空间的所有超平面可以类似二维空间,表示为:xwT+b=0xw^T+b=0xwT+b=0 nnn维空间中的点,到超平面的距离等于点到超平面的最短距离。 令xxx为nnn维空间某个超平面的点 : xwT+b=0xw^T+b=0xwT+b=0 根据定义,点PPP到超平面的距离显然为极小化:∣∣x−P∣∣2||x-P||^2∣∣x−P∣∣2 施瓦茨不等式 [a,b]2≤[a,a][b,b][a,b]^2\leq[a,a][b,b][a,b]2≤[a,a][b,b] 证明: 构造方程:∑i=1n(aix−bi)2=0\sum_{i=1}^{n}(a_ix-b_i)^2=0i=1∑n(aix−bi)2=0 由于:(aix−bi)≥0(a_ix-b_i)\geq0(aix−bi)≥0,则由方程可得:aix−bi=0a_ix-b_i=0aix−bi=0 所以,方程最多有一个根,则判别式Δ≤0\Delta \leq0Δ≤0 ∑i=1n(aix−bi)2=x2∑i=1nai2−2x∑i=1naibi+∑i=1naibi\sum_{i=1}^{n}(a_ix-b_i)^2\\=x^2\sum_{i=1}^na_i^2-2x\sum_{i=1}^na_ib_i+\sum_{i=1}^na_ib_ii=1∑n(aix−bi)2=x2i=1∑nai2−2xi=1∑naibi+i=1∑naibi 则:Δ=4(∑i=1naibi)2−4(∑i=1nai2)(∑i=1nbi2)≤0\Delta =4\Big(\sum_{i=1}^na_ib_i\Big)^2-4\Big(\sum_{i=1}^na_i^2\Big)\Big(\sum_{i=1}^nb_i^2\Big)\leq0Δ=4(i=1∑naibi)2−4(i=1∑nai2)(i=1∑nbi2)≤0 [a,b]2≤[a,a][b,b][a,b]^2\leq[a,a][b,b][a,b]2≤[a,a][b,b] 得证。 根据施瓦茨不等式:∣∣P−x∣∣2∣∣w∣∣2≥[P−x,w]2||P-x||^2||w||^2\geq[P-x,w]^2∣∣P−x∣∣2∣∣w∣∣2≥[P−x,w]2 ∣∣P−x∣∣2≥[P−x,w]2∣∣w∣∣2=([P,w]−[x,w])2∣∣w∣∣2=([P,w]+b)2∣∣w∣∣2||P-x||^2\geq\frac{[P-x,w]^2}{||w||^2}=\frac{([P,w]-[x,w])^2}{||w||^2}\\=\frac{([P,w]+b)^2}{||w||^2}∣∣P−x∣∣2≥∣∣w∣∣2[P−x,w]2=∣∣w∣∣2([P,w]−[x,w])2=∣∣w∣∣2([P,w]+b)2 也就是说:∣∣P−x∣∣2≥([P,w]+b)2∣∣w∣∣2||P-x||^2\geq\frac{([P,w]+b)^2}{||w||^2}∣∣P−x∣∣2≥∣∣w∣∣2([P,w]+b)2 可以看到,大于等于号右边都是常数,那么这也就是说([P,w]+b)2∣∣w∣∣2\frac{([P,w]+b)^2}{||w||^2}∣∣w∣∣2([P,w]+b)2是点到超平面距离的下界。 因为www是法向量,那么过PPP向超平面做法向量,必然存在x′x'x′有:P−x′=kwP-x'=kwP−x′=kw 其中kkk为常数。 那么,x′x'x′带入不等式有:∣∣P−x′∣∣2=∣∣kw∣∣2=k2∣∣w∣∣2||P-x'||^2=||kw||^2=k^2||w||^2∣∣P−x′∣∣2=∣∣kw∣∣2=k2∣∣w∣∣2 ([P,w]+b)2∣∣w∣∣2=([x+kw,w]+b)2∣∣w∣∣2=([x,w]+b+k∣∣w∣∣2)2∣∣w∣∣2=k2∣∣w∣∣2\frac{([P,w]+b)^2}{||w||^2}=\frac{([x+kw,w]+b)^2}{||w||^2}\\=\frac{([x,w]+b+k||w||^2)^2}{||w||^2}=k^2||w||^2∣∣w∣∣2([P,w]+b)2=∣∣w∣∣2([x+kw,w]+b)2=∣∣w∣∣2([x,w]+b+k∣∣w∣∣2)2=k2∣∣w∣∣2 那么,PPP到超平面[x,w]+b=0[x,w]+b=0[x,w]+b=0的距离为:min(∣∣P−x∣∣)=∣[P,w]+b∣∣∣w∣∣\min(||P-x||)=\frac{\Big|[P,w]+b\Big|}{||w||}min(∣∣P−x∣∣)=∣∣w∣∣∣∣∣[P,w]+b∣∣∣