深度学习中的对偶学习:原理、分类与应用
1. 深度学习的发展与挑战
深度学习正引领着人工智能(AI)的浪潮,近年来在计算机视觉、语音识别、自然语言处理和游戏等多个领域取得了突破性进展。例如,2015 年,拥有 152 层的深度卷积神经网络 ResNet 在大规模图像分类任务上实现了 3.57% 的错误率,超越了人类 5.1% 的错误率;2016 年,基于深度神经网络和树搜索的计算机围棋程序 AlphaGo 击败了围棋世界冠军;同年,一个语音识别系统在公共对话语音识别数据集上达到了 5.9% 的单词错误率,与人类表现相当;2018 年,一个基于深度神经网络的翻译系统在公共中文到英文新闻翻译数据集上达到了人类水平;2019 年,基于深度强化学习的计算机麻将程序 Suphx 成为历史上第一个 10 段的麻将 AI,并在稳定排名上超越了顶级人类玩家。
然而,深度学习的成功高度依赖于大规模的人工标注数据来训练深度神经网络。以下是不同任务所需的人类标注训练数据规模:
| 任务 | 系统 | 训练数据规模 |
| — | — | — |
| 图像分类 | ResNet | 数百万张图像 |
| 围棋 | AlphaGo | 数千万个专家棋步 |
| 语音识别 | DNNs | 数千小时的语音 |
| 机器翻译 | DNNs | 数千万个双语句子对 |
| 麻将 | Suphx | 数千万个专家行动 |
在实际应用中,获取人工专家进行数据标注通常成本高昂,而且在某些领域可能难以找到合适的专家。例如,对于两种罕见语言的翻译,可能世界上没有专家能够同时理解这两种语言。因此,虽然某些任务可能有丰富的标注训练数据,但更多任务的标注数据
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



