近期需要将一份Keras代码转写为Pytorch,有关LSTM的东西比较麻烦,特此记录。

第二个链接国内可能wall,故此贴上Pytorch的理解图。
----------------------------------------------------------------------------------------------------------------------------------------------------------------------
我遇到的keras代码是类似这样的:(return_sequences=Ture)
from keras.models import Model
from keras.layers import Input
from keras.layers import LSTM
from numpy import array
# define model
inputs1 = Input(shape=(3, 1))
lstm1 = LSTM(1, return_sequences=True)(inputs1)
model = Model(inputs=inputs1, output

本文记录了将Keras LSTM代码转换为Pytorch过程中的关键点,主要关注Keras的'return_sequences=True'与Pytorch LSTM输出'(h_n, c_n)'的区别。在Keras中,return_sequences=True表示每个时间步长都有输出,适合多对多的预测;反之,仅输出最后一个时间步长的值,适合多对一的预测。作者提供了一个股票预测的例子来说明这一点,并给出了动态结构的Pytorch LSTM代码示例。"
131523976,10754669,数仓分层解析:ODS、DWD、DWM与实战,"['数据仓库', '数仓模型', '数据分层', '数据库']
最低0.47元/天 解锁文章
3446

被折叠的 条评论
为什么被折叠?



