38 深度学习 用于处理序列的RNN

本文介绍了循环神经网络(RNN)的基本概念及其在处理序列数据中的应用,并深入探讨了长短时记忆网络(LSTM)如何解决梯度消失问题,同时提供了使用Keras实现RNN的示例。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

什么是RNN

Recurrent Neural Network,循环神经网络

还有一个东西叫RecNN,Recursive Neural Network,递归神经网络,感兴趣的童鞋自行搜索

 

输入长什么样?

  • 一个序列(例如一句话)
  • 每个元素都是一个向量(例如每个词的WordEmbedding)

 

循环是指,网络只有一层(全连接层),且其隐态h(t)取决于:

  • 当前时刻的输入x(t)
  • 上一时刻的隐态h(t-1)
  • h(t)=sigmoid(Wx(t)+Uh(t-1))

LSTM

Long Short-Term Memory,长短时记忆

解决梯度爆炸和梯度消失问题,学习长程依赖

模型更复杂、参数更多、学习能力更强

 

 

RNN通用套路

  • 整理输入数据,每句文本处理成固定长度,做Embedding
  • 将一句话的每个词逐一输入到RNN中,得到每一步的输出
  • 最后一步的输出可以视为整句话的一个融合
  • 接上分类器,输出
  • 可以和CNN结合,应用:看图说话、VQA等

 

Keras中的实现

SimpleRNN、GRU、LSTM

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值