机器学习（李宏毅）——RNN

龚大龙

于 2025-02-18 10:19:33 发布

阅读量993

点赞数 12

文章标签：机器学习 rnn 人工智能 lstm

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/m0_37970224/article/details/145633603

版权

一、前言

本文章作为学习2023年《李宏毅机器学习课程》的笔记，感谢台湾大学李宏毅教授的课程，respect！！！

二、大纲

引例
RNN历史
基本思想
RNN变形
RNN训练

三、引例

学习RNN之前先看一个例子：
假设要做一个火车订票系统（ticket booking system），给机器输入一句话“I would like to arrive Taipei on November 2nd. ”，期望机器能够自动识别“目的地”和“到达时间”，这该如何做到呢？

方法：训练一个神经网络（Feedforward network ），当输入看到Taipei时候就应该输出这是地名，看到November 2nd就应该输出时间，所以地名和时间就像是这句话的插槽（slot filling）一样。

但这个方法会有一个问题，比如我输入“leave Taipei on November 2nd. ”，同一个模型同样可以识别到地点和时间，但是这句话地点则是出发地，时间是出发时间。所以我们要把上下文语义信息关联上去，于是就有了RNN，也可以理解为有记忆的神经网络模型。

四、RNN历史

RNN称为递归神经网络，发展历史如下：

1980-1990 年代：RNN 的基础理论建立，但训练困难。
1997 年：LSTM 诞

最低0.47元/天解锁文章

博客等级

码龄8年

66
原创

495
点赞

1250
收藏

300
粉丝

关注

私信

分类专栏

展开全部收起

上一篇：: 机器学习（李宏毅）——GAN

下一篇：: 机器学习（李宏毅）——RL（强化学习）

最新评论

TT100K数据情况、扩增与检查
布鲁贝尔: 博主，怎样才能让粘贴的图片贴合原来的标志大小呀
机器学习（李宏毅）——Network Compression（神经网络压缩）
龚大龙: 可能我这边描述不太准确，这边想表达的是：小网络是大网络的一个子集，存在一个较小的子网络，它的表现几乎可以匹敌原始大网络，也说明了其他神经元是不重要的（可以被删除）
机器学习（李宏毅）——Network Compression（神经网络压缩）
RunMax2002: 大网络那部分不太理解为什么分成小网络以后小网络的表现会显著影响大网络？
机器学习（李宏毅）——RNN
龚大龙: RNN 通过记录记忆（memory）并传递隐藏状态来保留上下文信息，使得同一个词在不同的上下文中可以区分语义（向量值会不一样）。然而，RNN 在处理长序列时容易出现梯度消失问题，而 LSTM 通过引入门控机制有效缓解了这一问题。这是我的理解，请多指正！
TT100K数据情况、扩增与检查
IVEvolution: 博主，请问最后的检查程序是什么？

大家在看

最新文章

目录

展开全部

收起

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

龚大龙 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。