3、计算机视觉中的深度学习:进展与威胁

计算机视觉中的深度学习:进展与威胁

1 引言

基于深度学习的算法可分为自动特征学习和分类算法。为有效学习这些特征,通常需要大量数据和计算资源。大规模数据库的出现和计算资源的进步,使深度学习在解决复杂任务方面取得了巨大成功,在受限和半受限环境的多项任务中,深度学习算法甚至能超越人类水平。不过,问题仍未完全解决,还需进一步关注。下面将简述深度学习算法在物体识别和生物识别这两个热门任务中的成功应用。物体识别是将自然图像(如狗、猫和汽车)分类到相应类别,而生物识别则是基于生理和行为特征(如面部、指纹、签名和步态)识别人。文献中提出了多种深度学习算法,如用于潜在特征表示和通过非线性函数降维的自动编码器(AE)、用于特征表示学习和分类的卷积神经网络(CNN)、用于成对层学习并作为未来网络训练预训练网络的玻尔兹曼机(BM),以及用于处理序列和可变长度输入数据(如时间序列数据)的循环神经网络(RNN)。其中,CNN和RNN是处理序列数据(如语音)和固定大小数据(如图像)最流行的两种深度学习架构。此外,生成网络(GANs)和视觉变换器最近也备受关注。GAN架构用于生成高质量、高分辨率的合成图像,而视觉变换器旨在提高CNN解决计算机视觉任务的能力。

2 物体识别中的深度学习

2.1 数据库

随着对物体检测和识别的兴趣日益浓厚,研究人员发布了多个数据库。以下是一些流行的物体识别数据库:
1. MNIST :1999年发布的数字识别数据库,至今仍广泛用于新算法的基准测试。数据集包含低分辨率(28x28)的单通道灰度图像,分为训练集(60,000张图像)和测试集(10,000张图像)。
2. SVHN

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值