序列模型：循环神经网络（RNN）+长短时记忆神经网络（LSTM）

KangKang——

已于 2024-07-26 17:17:25 修改

阅读量1.1k

点赞数 13

分类专栏：吴恩达深度学习笔记文章标签： rnn gru lstm 语言模型

于 2024-07-26 17:16:39 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/m0_51263060/article/details/140683083

版权

一.传统的神经网络与循环神经网络处理文本序列的区别

1.传统神经网络处理文本序列

（1）在不同的例子中，输入长度Tx和输出长度Ty可能不一样，因此可能用的padding或零填充，但是效果不是很好。

（2）传统的神经网络，并不能共享从文本的不同位置上学到的特征。

2.循环神经网络处理文本序列

循环神经网络（RNN）对于自然语言处理和其他序列任务非常有效，因为它们具有“记忆”功能。它们可以一次读取一个输入 $x^{<t>}$ (如单词），并且通过隐藏层激活从一个时间步传递到下一个时间步来记住一些信息/上下文，这允许单向RNN从过去获取信息来处理后面的输入，双向RNN可以从过去和未来中获取上下文。

二、循环神经网络（RNN）

1.符号说明

上标[l]表示第l层。如， $a^{[l ] }$ 表示 $W^{[l]},b^{[l]}$ 。
上标（i）表示第 i 个样本。如， $x^{(i)}$ 表示第i个输入样本。
上标< t >表示第 t 个时间步。如， $x^{<t>}$ 表示输入x的第t个时间步， $x^{(i)<t>}$ 表示输入第i个样本的第t个时间步。
下标 i 表示向量的第 i 项。如， $a^{[l]}_{i}$ 表示l层中的第i个项的激活值。

最低0.47元/天解锁文章

博客等级

码龄5年

15
原创

237
点赞

303
收藏

179
粉丝

关注

私信

热门文章

分类专栏

展开全部收起

上一篇：: 卷积神经网络的应用：人脸识别+神经网络风格迁移

下一篇：: 词嵌入技术：构建词嵌入的相关算法+词嵌入消除偏见

最新评论

解决惠普Win10电脑没有wifi图标、网络适配器中无线网卡显示黄色感叹号
摘星X揽月: 20年买的惠普，今天遇到这个问题，楼主的方法确实有效！
机器学习基础知识
优快云-Ada助手: 推荐 Python入门技能树：https://edu.youkuaiyun.com/skill/python?utm_source=AI_act_python
Logistic回归:一种有监督学习的二元分类模型
优快云-Ada助手: 非常棒的博文！你对Logistic回归的解释清晰明了，让人受益匪浅。希望你能继续分享更多关于监督学习和分类模型的知识。此外，如果你想深入了解模型评估和调参的话题，或讨论特征工程的重要性，可能会对你的学习和实践有所帮助。期待看到你更多的精彩内容！继续加油！如何写出更高质量的博客，请看该博主的分享：https://blog.youkuaiyun.com/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2
Logistic回归:一种有监督学习的二元分类模型
优快云-Ada助手: 非常精彩的博文！通过对Logistic回归的深入解析，我对这种有监督学习的二元分类模型有了更清晰的认识。不过除了梯度下降法和成本函数的相关知识外，你可能也会对特征工程、模型评估指标、模型调参等内容感兴趣。这些都是在实际应用中非常重要的扩展知识和技能，相信你掌握后会更加游刃有余地运用Logistic回归模型。期待你更多的创作，加油！如何写出更高质量的博客，请看该博主的分享：https://blog.youkuaiyun.com/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。