模式识别——特征提取(表达)

特征表达

特征是机器学习系统的原材料,对最终模型的影响是毋庸置疑的;如果数据被很好地表达成了特征,通常线性模型就能达到满意的精度。关于特征,需要考虑以下三方面:

(1)特征表示的粒度

需要考虑,模型在一个什么程度上的特征表示,才能发挥效果?以图片为例,像素级的特征完全没有价值,从中得不到任何可用于分类或识别的信息。

当特征具有结构性(有意义)的时候,算法才能起作用,即将输入空间通过某种规则映射到特征空间,使得有助于分类。如下图所示,当可以判断是否有车把手,是否有车轮,就可以很容易的把摩托车和非摩托车区分开。
在这里插入图片描述

(2)初级(浅层)特征表示

1995 年前后,Bruno Olshausen和 David Field收集了很多黑白风景照片,提取出400个小碎片,每个小碎片的尺寸均为 16x16 像素,对这400个碎片标记为 S i , i = 0 , ⋯   , 399 S_i,i=0,\cdots,399 Si,i=0,,399;再从这些黑白风景照片中,随机提取另一个碎片,大小为 16 × 16 16\times16 16×16 像素,把这个碎片标记为 T。

问题:如何从这400个碎片中,选取一组碎片 S k S_k Sk,通过叠加的办法,合成出一个新的碎片,而这个新的碎片应当与随机选择的目标碎片 T 尽可能相似,同时, S k S_k Sk 的数量尽可能少。该问题的属性描述为: ∑ k a k ⋅ S k → T \displaystyle\sum_k a_k\cdot S_k\to T kakSkT,其中 a k a_k ak 为叠加碎片 S k S_k Sk 时的权重系数。

因此,他们提出了 稀疏编码(Sparse Coding)算法,这是一个重复迭代的过程,每次迭代分两步:

A. 选择一组 S k S_k Sk ,然后调整 a k a_k ak ,使得 ∑ k a k ⋅ S k \displaystyle\sum_k a_k\cdot S_k kakSk 最接近 T;
B. 固定 a k a_k ak,在 400 个碎片中,选择其他更合适的碎片 S k ′ S'_k Sk,替代原先的 S k S_k Sk,使得 ∑ k a k ⋅ S k ′ \displaystyle\sum_k a_k\cdot S'_k kakSk 最接近 T。
经过多次迭代后,选出最佳的 S k S_k Sk 组合。令人惊奇的是,被选中的 S k S_k Sk 基本上都是照片上不同物体的边缘线,这些线段形状相似,区别在于方向

这表明,复杂图像往外由一些基本结构组成任意一幅图可以用 64 种正交的 e d g e s edges edges(正交的基本结构)线性表示。如下图所示:
在这里插入图片描述

实际上,不仅图像中存在这个规律,声音中也存在。从未标注的声音中发现了20种基本的声音结构,其余的声音可以由这20种基本结构合成
在这里插入图片描述

(3)结构性特征表示

小块的图形可以由基本edge构成,更结构化,更复杂的,具有概念性图形的表示就需要更高层次的特征表示,比如V2,V4。V1看像素级是像素级。V2看V1是像素级,是层次递进的,高层表达由底层表达的组合而成;以图像的基basis说明。V1层提出的basis是边缘,然后V2层是V1层这些basis的组合,这时候V2区得到的又是高一层的basis,上上层又是上一层的组合basis结果 ⋯ ⋯ \cdots\cdots 在这里插入图片描述

直观的,以Bruno Olshausen和 David Field的实验为例,就是就是找到有意义的小碎片(patch),再将其进行组合(combine),就得到了上一层的特征(feature),递归地向上学习特征(learning feature)。在不同对象(object)上做训练时,所得的边缘基(edge basis)是非常相似的,但对象部分(object parts)和模式(models)完全不同。这样便于图像的准确识别
在这里插入图片描述

全书,搞了很久才搞到。。。想传数字图像处理全书的,可惜我没有权限。要的朋友可以联系我 正如前面已经提到的那样,本书重点讨论统计模式识别方法中的特征提取和分类决策。 从教学角度出发,首先研究各种分类器的设计方法是qJ取的,在这个基础上就更容易理解特 征提取和选择的重要性。对于一个实际的模式识别系统,当然只有在特征确定以后,才能对 分类器的参数进行计算。实际工作中,这两者常常是互相交又进行的,对不同的方案要进行 反复比较,特别是设计过程还可能影响到对训练集的重新编辑。本书的前几章着重讨论监 督学习,即已知训练集样本所属类别的条件下分类器的设计方法。然后讨论特征提取和选择 的准则和算法。在这之后,讨论在不利用或没有样本所属类别信息的情况下的分类方法,即 非监督模式识别方法。根据有关模式识别理论和技术的发展、我们在讨论了统计模式识别的 经典内容之后,分别在第ll章中介绍“人工押经网络”,在第12章中介绍“模糊模式识别方 法”及第13章中介绍“统计学习理论和支持向量机”。最后在第14章巾简要介绍“模式U1别 在语音信号数字处理中的应用举例”、第15章中介绍“印刷体汉字识别小的特征提取”。希望 通过这些实例使读者对一些模式识别方法在一维信导和二维因像识别中的应用钉一个更直 观的认识;同时也可了解到利用信号处理和图像处理技术获取模式识别的特征的一些常用 方法。当然,由于篇幅和本书的目的所限,对这些例子的介绍只能是较简单的,仪供读者参 考,在学习模式识别课程时可以不讲、感兴趣者可以课后阅读。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值