1. 深度学习概念
深度学习的概念来源于人工神经网络(Artificical Nerural Network,ANN),所以又被称为深度神经网络(Deep Neural Network, DNN)。人工神经网络主要使用计算机的计算单元和存储单元模拟人类神经大脑系统中大量的神经细胞(神经元)通过神经纤维传导并相互协同工作的原理。
深度学习通过算法构造多层神经网络,经过多层处理,逐渐将初始的底层特征转换为高层特征表示,再用自学习模型便可完成复杂的分类等学习任务。
因此,可将深度学习理解为深度特征学习或深度表示学习。
典型的深度学习模型又卷积神经网络(Convolutional Neural Network,CNN)、循环神经网路(Recurrent Neural Network,RNN)、长短时记忆神经网络(Long Short-Term Memory,LSTM)
深度置信网络(Deep Belief Network ,DBN)。
2. 深度学习原理
传统的机器学习算法需要手工编码特征
,这个过程不仅耗时
,而且需要较高的专业知识和一定的人工参与
才能完成。相比之下,深度学习直接从数据中自动学习各种特征并且进行分类或识别。因此,在解决复杂问题(如目标识别、自然语言处理等)时,传统的机器学习通常把问题分为几块,一个一个地解决再进行组合,但是深度学习则是端到端(end-to-end)的解决。如下图
具体来说,深度学习与机器学习的不同之处在于:
- 强调模型结构的深度,隐藏层一般5、6层,多者甚至十几、几十层。
- 明确特征学习的重要性,逐层进行特征变