海晨威:一幅图真正理解LSTM的物理结构zhuanlan.zhihu.com


这个是网上看的最多的图了,但是在理解lstm的应用过程中的时候这个图带来了不少麻烦。

展开之后实际的物理结构是这样的,1、2图同颜色的点代表了同一个东西;
问题1:

这里的输入xt和ht是怎么结合的?比如:

这块儿很多地方都没讲清楚,实际上就是concat,直接concat起来了:

问题2:LSTM的权重到底是啥样的?
这里直接以tf.keras的代码为例子看看就造了:
def build_model(look_back: int, batch_size: