PyTorch -- LSTM 快速实践

CODE_RabbitV

已于 2024-06-20 11:23:51 修改

阅读量1.4k

点赞数 8

CC 4.0 BY-SA版权

分类专栏： PyTorch 学习文章标签： pytorch lstm 人工智能

于 2024-06-20 11:19:35 首次发布

本文链接：https://blog.youkuaiyun.com/CODE_RabbitV/article/details/139811120

上篇介绍了 RNN 快速实践；使用 LSTM 的话，可以解决梯度离散及短期记忆问题；代码部署方面，增加了 c 值 (即 RNN 中的 h 变成了 LSTM 中的 (h,c)), 可对照 RNN 快速实践来快速掌握。

LSTM Layer torch.nn.LSTM(input_size,hidden_size,num_layers,batch_first)
- input_size: 输入的编码维度
- hidden_size: 隐含层的维数
- num_layers: 隐含层的层数
- batch_first: ·True 指定输入的参数顺序为：
  - x：[batch, seq_len, input_size] # 或者用符号 c0
  - h0：[batch, num_layers, hidden_size]
LSTM 的输入：
- x：[seq_len, batch, input_size] # 或者用符号 c0
  - seq_len: 输入的序列长度
  - batch: batch size 批大小
- (h0, c0)：[num_layers, batch, hidden_size]
LSTM 的输出：
- y: [seq_len, batch, hidden_size]
- (ht, ct)：[num_layers, batch, hidden_size]

..........

三个门 ( $\sigma$ 处:遗忘f、输入i、输出o) 都是基于 $\mathbf{x}_t$ 和 $\mathbf{h}_{t-1}$ 产生，但是分别对应要学习的权重参数 $W$ 不同，或可参照下简化图直观理解 LSTM 模块内部的处理流程

实战之预测 正弦曲线：以下会以此为例，演示 RNN 预测任务的部署

下述示例代码已注明区别行 ########################### （共3处）

步骤一：确定 RNN Layer 相关参数值并基于此创建 Net (RNN->LSTM)

import numpy as np
from matplotlib import pyplot as plt

import torch
import torch.nn as nn
import torch.optim as optim


seq_len     = 50
batch       = 1
num_time_steps = seq_len

input_size  = 1
output_size = input_size
hidden_size =