LSTM理解与pytorch使用

原创

于 2020-07-01 10:29:43 发布 · 2.6k 阅读

·

3

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#机器学习 #pytorch #神经网络

本文深入解析了LSTM的结构原理，阐述其在处理时序数据如视频和句子方面的应用，并通过实例展示了Pytorch中LSTM的使用方法及参数配置，包括输入输出格式、隐藏层信息获取等。

LSTM理解与pytorch使用

引言
LSTM结构
- 总体结构
- 详细结构
Pytorch用法

引言

LSTM应该说是每一个做机器学习的人都绕不开的东西，它的结构看起来复杂，但是充分体现着人脑在记忆过程中的特征，下面本文将介绍一下LSTM的结构以及pytorch的用法。

LSTM结构

总体结构

在这里插入图片描述
首先，LSTM主要用来处理带有时序信息的数据，包括视频、句子，它将人脑的对于不同time step的记忆过程理解为一连串的cell分别对不同的时刻输入信息的处理。

详细结构

一个典型的 LSTM 结构可以分别从输入、处理和输出三个角度来解析:

输入: 输入包含三个部分，分别是 cell 的信息𝐶_t-1,它代表历史的记忆细胞（cell）状态信息的汇总;隐藏层的信息h_t-1, 它是提取到的上个时刻的特征信息; 以及当前的输入𝑥_t。
处理: 处理部分主要是由遗忘门、输入门、输出门组成。遗忘门由当前的输入和隐藏层信息控制对于历史的 cell 信息的遗忘程度;输入门是决定当前的输入和隐藏
层信息的利用程度;输出门是由当前的 cell 状态和输入决定输出。
输出: 分别是当前的 cell 状态𝐶’和当前的隐藏层信息h’。

遗忘门：
在这里插入图片描述
输入门：

细胞状态更新：

输出门：

Pytorch用法

参数介绍

class torch.nn.LSTM(*

最低0.47元/天解锁文章

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。