深度学习 LSTM

最新推荐文章于 2025-11-16 07:22:43 发布

原创

最新推荐文章于 2025-11-16 07:22:43 发布 · 2.5k 阅读

2 ·

CC 4.0 BY-SA版权

本文介绍了深度学习中LSTM模型的应用，强调了神经网络处理单位为向量。通过load_data函数拆分数据集，时间步长设定为14。在train_model函数中构建模型并进行训练，使用SGD优化器，设置了验证集比例和批大小。每个epoch中，根据batchsize和样本数量计算迭代次数，解释了nsteps和diminput在LSTM中的含义。

第一要明确的是神经网络所处理的单位全部都是：向量

常规Recurrent (RNN/LSTM/GRU) 输入和输出：张量

输入张量形状：(time_steps, n_samples, dim_input)
输出张量形状：(time_steps, n_samples, dim_output)
注：同样是保留了Mini-batch gradient descent的训练方式，但不同之处在于多了time step这个维度。

作者：YJango
链接：https://www.zhihu.com/question/41949741/answer/124898736
来源：知乎
著作权归作者所有，转载请联系作者获得授权。