这篇论文里的吐槽点在于,连个图都没有?
highway Network 解决的是深度神经网络的训练问题。
文章的核心如下
普通的前馈神经网络中对输入 x 进行非线性变化后为 y:
本文收 LSTM 长短期记忆的启发,提出如下结构,也是本文 highway Network 的结构:
其中,
T 表示 transform gate,C 表示 carry gate,C和T的激活函数都是sigmoid函数。简单的;令 C = 1 - T,转换公式(2)后如下
这篇论文里的吐槽点在于,连个图都没有?
highway Network 解决的是深度神经网络的训练问题。
文章的核心如下
普通的前馈神经网络中对输入 x 进行非线性变化后为 y:
本文收 LSTM 长短期记忆的启发,提出如下结构,也是本文 highway Network 的结构:
其中,
T 表示 transform gate,C 表示 carry gate,C和T的激活函数都是sigmoid函数。简单的;令 C = 1 - T,转换公式(2)后如下