深度学习架构、库与框架全解析
1. 深度学习简介
近年来,深度学习变得非常突出,在解决许多复杂问题方面能提供令人满意的结果。它的潜力和价值是无限的,能够适应任何问题领域,因为其架构模仿了不同动物中枢神经系统中神经元的内部工作方式。不过,深度学习一直面临高质量数据集不足的问题,但最近出现的一些技术,如深度强化学习和生成对抗网络架构,在解决数据集不足甚至没有数据集的问题上取得了成功。
深度学习架构对硬件配置要求较高,因为先进的深度学习架构具有复杂的隐藏层,训练深度模型需要大量的计算资源。从事深度学习工作需要使用许多库、框架、先进的机器学习技术、优化和损失算法、高性能硬件以及大量标记数据集。
2. 深度学习概述
2.1 深度学习的基本概念
深度学习是机器学习这一人工智能类别中的一个复杂子领域。深度学习模型能够从原始输入数据或与环境的交互中逐步提取更高级别的特征。与传统机器学习不同,它使用分层的多层架构来学习数据的多个表示层次,每层都进行自己的转换。
深度学习架构通常使用人工神经网络(ANN)技术,从原始或随机输入以及环境交互中学习更高级别的特征。ANN 是一种机器学习架构,通过模仿动物大脑中生物神经网络的工作原理,以类似人类的方式执行认知任务,如模式识别和决策。
2.2 深度学习的发展历程
深度学习的发展历程可以追溯到 1943 年,以下是其重要发展节点:
| 年份 | 贡献 |
| ---- | ---- |
| 1943 | Walter Pitts 和 Warren McCulloch 开发了第一个神经网络的数学模型,即 McCulloch