计算机视觉与神经网络:从基础到深度学习
1. 计算机视觉特征提取与机器学习的融合
早期,人们开发了一些图像特征提取方法,如提取SIFT关键点。多年来,更先进的方法不断涌现,它们能更稳健地提取关键点、计算和组合判别特征,但总体流程仍是从一张图像中提取特征,再与其他图像的特征进行比较。
不过,对于识别任务而言,提取稳健且有判别力的特征只是成功的一半。例如,同一类别的不同元素外观可能差异很大,像不同品种的狗,它们共有的特征集较小。因此,对于语义分类等高级问题,不能仅通过比较查询图像和标注图像的像素特征来解决,而且若要与大型标注数据集中的每幅图像进行比较,处理时间也会变得很长。
这时,机器学习就发挥了作用。20世纪90年代,越来越多的研究人员尝试解决图像分类问题,基于图像特征进行判别的统计方法开始出现。支持向量机(SVM)在很长一段时间内是将复杂结构(如图像)映射到简单标签(如类别)的默认解决方案。给定一组图像特征及其二进制标签(如猫或非猫),SVM可以通过优化学习一个函数,将不同类别分开。之后,只需将该函数应用于未知图像的特征向量,就能将其映射到相应类别。除了SVM,计算机视觉领域还采用了其他机器学习算法,如随机森林、词袋模型、贝叶斯模型和神经网络。
2. 神经网络的发展历程
2.1 早期尝试与失败
令人惊讶的是,人工神经网络的出现甚至早于现代计算机视觉。其发展是一个“生不逢时”的典型故事。
2.2 感知机的兴衰
20世纪50年代,Frank Rosenblatt提出了感知机,这是一种受神经元启发的机器学习算法,也是最早的神经网络的基础。在适当的学习过程下,感知机能够识别字符。然而,其热度很快消
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



