支持向量机和人工神经网络的使用区别或者说局限:
支持向量机:一般适用小样本;
人工神经网络:通常会集中在局部最小值而不是全局最小值,这意味着它们有时基本上“错过了大局”,而且训练时间过长,人工神经网络常常会过度拟合,这意味着对于任何给定的模式,人工神经网络可能会开始将噪音视为模式的一部分。不过它有一个优点是样本可大可小。
概念:
特征(features):可以描述模式特性的量(测量值)。在统计模式识别方法中,通常用一个矢量表示,称为特征矢量,记为X=(x1,x2,...xn)'。【落实到数学上,把特征量化,用一个矢量表示】。
模式类(class):具有某种共同特征的模式的集合。
什么是特征:
特征提取:由于模式是抽象的事物特征,因此,它需要在“认知”的过程中,从大量属于同一种类的事物中归纳总结出来。例如,长颈鹿可以从身体形态,个头大小,皮肤花纹,等等方面抽象归纳出来长颈鹿的共同特征,当有一张新的动物图片供我们识别时,我们就可以依据这些特征来判断该动物是否是长颈鹿,能否划归到“长颈鹿”这一动物种类中去。
特征提取另一个例子:
颜色特征:将两个颜色转化为特征值,一种最简单的方式是直接以两个颜色值(r,g)作为特征值。(二维)【原始特征】
另外一种方式是取两种颜色的比值作为特征值:c=r/g(一维)【非原始特征】,特征变换而来。
上面是从颜色角度作为特征来讨论的,下面我们来换个角度看看如果把形状作为特征,应该怎么进行特征提取。
形状特征:需要对图像进行分割,寻找到图像的边缘;
上面的形状参数是一个比值,一维。
说到这里,我们要记得:特征是一个矢量,维度太高对我们识别也会造成困难。因此如果能降低维度(特征降维),可以大大加快我们的识别工作速度,但是有一个前提:降维不可以造成识别率的下降,模式识别最重要的是识别率。另外注意有一些情况,会有升高维度的情况。这个以后遇到的时候再说。
为什么要进行特征选择?
为什么要进行特征提取?