深度学习架构与TensorFlow基础入门
1. 深度学习架构概述
深度学习领域有数百种不同的模型,它们结合了各种深度学习的基本元素。以下介绍一些具有影响力的深度学习架构:
- LeNet :1988年提出,可认为是首个著名的“深度”卷积架构,用于文档的光学字符识别(OCR)。但由于当时计算机硬件的限制,其计算成本过高,该设计在之后几十年里相对默默无闻。
- AlexNet :在2012年的ImageNet大规模视觉识别挑战赛(ILSVRC)中,AlexNet基于对LeNet的改进并运行在强大的图形处理单元(GPU)上,以比最接近的竞争对手低一半的错误率赢得比赛,这极大地推动了计算机视觉领域向深度学习架构的发展趋势。
- ResNet :2015年ILSVRC挑战赛的获胜者,架构深度可达130层。传统的极深网络存在梯度消失问题,信号在网络中传播时会衰减,导致学习效果不佳。ResNet引入了旁路连接(bypass connection),允许部分来自深层的信号无衰减地通过,从而能够有效训练更深的网络。
- 神经字幕生成模型(Neural Captioning Model) :结合卷积网络和长短期记忆网络(LSTM),能够自动为图像内容生成描述性的字幕。整个系统进行端到端训练,减少了对复杂输入预处理的需求。
- 谷歌神经机器翻译(Google Neural Machine Translation) :采用端到端训练范式构建生产级翻译系统,基于LSTM构建,在大量翻译句子数据集上训练,大幅
超级会员免费看
订阅专栏 解锁全文
536

被折叠的 条评论
为什么被折叠?



