一、LSTM神经网络
1、关于传统RNN网络梯度消失的问题
https://blog.youkuaiyun.com/dchen1993/article/details/53885490
http://www.cnetnews.com.cn/2017/1118/3100705.shtml
其中涉及到softmax函数的求导:https://blog.youkuaiyun.com/u014313009/article/details/51045303
传统RNN网络梯度消失主要是因为,在往回求导时,St和St-1...S1,S0都有联系,因此都需要对它们求导,所以: