第七周：深度学习基础

L-含光承影

于 2024-10-20 20:28:32 发布

阅读量996

点赞数 22

文章标签：深度学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/m0_59510256/article/details/143093605

版权

目录

1. 普通RNN的缺点

2. 长短期记忆网络（LSTM）

2.1 LSTM 的核心思想

2.2 拆分理解 LSTM

摘要

本文探讨了传统循环神经网络（RNN）的局限性，包括在处理长序列数据时容易忽略远距离依赖信息，以及在训练过程中可能遇到的梯度消失或梯度爆炸问题。为了解决这些问题，文章介绍了一种改进的RNN模型——长短期记忆网络（LSTM），旨在提高模型对长序列数据的处理能力。文中详细阐述了LSTM的核心思想并对其结构和工作流程做了详细介绍。

Abstract

This article explores the limitations of traditional Recurrent Neural Networks (RNNs), including their propensity to overlook long-range dependency information when processing long sequence data, as well as the potential issues of vanishing or exploding gradients encountered during training. To address these challenges, the article introduces an improved RNN model—Long Short-Term Memory networks (LSTMs)—that aims to enhance the model's capability to handle long sequence data. The article provides a detailed explanation of the core concepts of LSTMs and offers an in-depth introduction to their structure and workflow.

1. 普通RNN的缺点

对于序列任务，RNN解决了普通神经网络不能共享各个时间步学习到的特征的问题，使每个时间步的输出不仅与当前的输入有关，还与其他时间步的输出信息有关，但普通的RNN在共享信息是也存在问题。

由当前时间步的计算方法可以看出，当考虑到的时间步离当前时间部越远，则它对当前时间步的影响就越小，但实际上距离当前时间步较远的时间步的信息可能也对当前的输出有较大的影响。

因为普通RNN的信息传递是逐层传递的，距离越远，其信息丢失越多，对于距离越远的时间步的输出的影响越小。

举一个例子，预测下面两句英文的下划线处应该是什么单词。

最低0.47元/天解锁文章

博客等级

码龄4年

33
原创

597
点赞

677
收藏

347
粉丝

关注

私信

热门文章

最新评论

【第三十三周】BLIP论文阅读笔记
优快云-Ada助手: 你好，优快云开始提供 #论文阅读# 的列表服务了。请看：https://blog.youkuaiyun.com/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
【第三十二周】CLIP 论文阅读笔记
优快云-Ada助手: 你好，优快云开始提供 #论文阅读# 的列表服务了。请看：https://blog.youkuaiyun.com/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
【第三十一周】ViT 论文阅读笔记
优快云-Ada助手: 你好，优快云开始提供 #论文阅读# 的列表服务了。请看：https://blog.youkuaiyun.com/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
【第二十三周】SAM（Segment Anything）
shuttle6: 方便问一下博主，文中的代码来自哪个项目吗？
【第二十周】U-Net：用于生物图像分割的卷积神经网络
优快云-Ada助手: 恭喜你这篇博客进入【优快云每天值得看】榜单，全部的排名请看 https://bbs.youkuaiyun.com/topics/619545083。

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。