这一章简单理解下大名鼎鼎的支持向量机,SVM;
还是先举个栗子:
有一条路把一片森林分开两块,左边是杨树,右边是松树,那么如果我们找一个分界线的话,当然就是这条路,这个是个很简单的分类方式;
下一个场景:
我们坐直升飞机在山顶飞过,这时候山对我们来说就是个平面,看到下面有两种树:松树和杨树,假设我们往下看的时候,发现杨树都在最外面一圈,而松树都在里面那一圈,我们用什么方法把他们分隔开呢?当然可以说我们画个圆就行,但是如果我们需要用一个平面来分类呢?
其实也好办,按照树木生长的属性,一般松树在山顶,杨树在山脚,如果我们下了直升飞机,侧面去看这个树木分布的话,是可以用一个平面去分割,类似如下图:
从平面到高维空间的变化,是通过一种核技巧(kernel)的方式,下面的视频可以更容易让人理解:
墙内:
那么理论上,SVM和神经网络都是用一种方式进行数据集的分类,我认为不同的地方主要就是分类的方式:
神经网络可以在同一平面用非线性的方式进