1 基本概念
hand-crafted: 传统手工方法就是人工设计的一步步能够说出理由来的方法。
end-to-end: 即端到端方法,意思是只有输入端和输出端,当中不需要设计和具体算法,就是一个神经网络。输入原始数据,输出结果即可。神经网络方法就是所谓end-to-end的
2 缘由:特征提取的区别
特征提取是CV领域核心问题之一(之二自然是分类问题,没有之三),特征提取从思路上有两大类:一类是手动设计(hand-crafted)的方式,一类是纯学习的方式,这两种方式都是在某些生物神经理论的基础下进行的, 不同之处是hand-crafted的方式设计的是特征本身,而纯学习的方式设计的是特征提取的框架结构。换种方式来说,就好比是hand-crafted特征是模仿我们所知的人类视觉的流程得到特征,而纯学习的方式重点是学习这个流程本身。这里都是针对无监督(unsupervised)的特征,也就是在没有label的情况下,直接从数据中学习特征,如果是结合label的特征学习就是监督学习了(supervised)。
hand-crafted特征:
顾名思义人为设计的特征,即直接设计特征本身,根据仿照人类视觉的特点对什么样的特征敏感,什么样的特征不敏感提取图像中有区分能力的特征,因此提取出来的特征每一维往往都有具体的物理含义。目前最牛X的hand crafted 的特征常见的有反应纹理特点的方向梯度类特征sift,surf,hog等,反应轮廓形状的shape context等,它们都是经过了很长的时间对人眼敏感信息的特点设计出来的,如果把所需学习的目标换成视频,则也同样需要把这些算法扩展到3D,比如HOG3D,3Dsurf。这些基本属于底层视觉特征,理论依据一般是V1区视觉特性。
其不足之处在于:
- 需要根据数据的特点精心设计,虽然是在众多的视觉神经理论依据下,但是难免有人为的想当然的成分。
- 往往依赖于数据库,也就是说设计的特征只对某些数据库表现好,而对其它的数据库效果并不能保证就好。或者当把数据来源发生变化,比如对RGB数据设计的特征换成Kinect深度图像,这些特征点就不一定适

本文探讨了计算机视觉领域中的两种特征提取方法:手工设计(hand-crafted)与端到端(end-to-end)方法。hand-crafted方法依赖于人工精心设计的特征,而end-to-end方法则通过神经网络自动学习特征。
最低0.47元/天 解锁文章
778





