作者:禅与计算机程序设计艺术
1.简介
1.1什么是神经网络?
人工神经网络(Artificial Neural Network,ANN)是一个基于神经元网络模型的集成学习系统。它由一个带有输入、输出、隐藏层以及激活函数的多层结构组成。在人工神经网络中,有些神经元之间的连接代表着信号的传递,而有些连接并不直接相连。通过反复迭代神经元之间的数据流动,并利用中间结果对输入数据进行逼近或预测,神经网络可以模拟出许多复杂的非线性动态系统,如图像识别、语音识别、机器翻译等。
1.2什么是LSTM?
长短时记忆神经网络(Long Short-Term Memory,LSTM)是一种递归神经网络,能够对序列数据进行更好地建模。LSTM网络中的每一单元是一个门控结构,其中有三个输入、三个输出以及一个遗忘门。LSTM网络使用了门控结构,能够在处理长时间序列数据时更加灵活有效。
1.3为什么需要LSTM?
传统的循环神经网络(Recurrent Neural Networks,RNN)存在梯度消失或者爆炸的问题,并且容易发生梯度弥散(Gradient Vanishing/Exploding)。为了解决这些问题,研究人员