计算机视觉中的深度学习:进展与威胁
1 引言
基于深度学习的算法可分为自动特征学习和分类算法。为有效学习这些特征,通常需要大量数据和计算资源。大规模数据库的出现和计算资源的进步,使深度学习在解决复杂任务方面取得了巨大成功,在受限和半受限环境的多项任务中,深度学习算法甚至能超越人类水平。不过,问题仍未完全解决,还需进一步关注。下面将简述深度学习算法在物体识别和生物识别这两个热门任务中的成功应用。物体识别是将自然图像(如狗、猫和汽车)分类到相应类别,而生物识别则是基于生理和行为特征(如面部、指纹、签名和步态)识别人。文献中提出了多种深度学习算法,如用于潜在特征表示和通过非线性函数降维的自动编码器(AE)、用于特征表示学习和分类的卷积神经网络(CNN)、用于成对层学习并作为未来网络训练预训练网络的玻尔兹曼机(BM),以及用于处理序列和可变长度输入数据(如时间序列数据)的循环神经网络(RNN)。其中,CNN和RNN是处理序列数据(如语音)和固定大小数据(如图像)最流行的两种深度学习架构。此外,生成网络(GANs)和视觉变换器最近也备受关注。GAN架构用于生成高质量、高分辨率的合成图像,而视觉变换器旨在提高CNN解决计算机视觉任务的能力。
2 物体识别中的深度学习
2.1 数据库
随着对物体检测和识别的兴趣日益浓厚,研究人员发布了多个数据库。以下是一些流行的物体识别数据库:
1. MNIST :1999年发布的数字识别数据库,至今仍广泛用于新算法的基准测试。数据集包含低分辨率(28x28)的单通道灰度图像,分为训练集(60,000张图像)和测试集(10,000张图像)。
2. SVHN
超级会员免费看
订阅专栏 解锁全文
23万+

被折叠的 条评论
为什么被折叠?



