论文学习笔记 - BIRNN - 1

本文介绍了如何利用序列数据的两个方向信息,对比了Merge方式和双向RNN(BiRNN)的区别。BiRNN通过结合前向和后向RNN的状态,提供更丰富的信息利用,而Merge则是简单合并两个方向的预测结果。虽然BiRNN更复杂,但其信息利用程度更深。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

  单向RNN(forward和backward)只利用了序列数据其中一个方向的信息(left-to-right或者right-to-left),信息量不够,在很多任务中往往达不到性能要求。要想提高模型性能就要尽可能多的利用数据信息,该如何利用序列两个方向上的信息?至少有2种方式可以利用序列数据两个方向上的信息,一是merge两个不同方向的RNN,二是BiRNN。

Merge

  Merge是指组合两个独立的单向RNN的预测结果。即分别独立训练两个RNN,一个forward,提取left-to-right方向上的特征,而另一个backward,提取right-to-left方向上的特征,最后将两个RNN的预测输出按照某种方式组合,比如线性等。

  此种方式利用了两个单向RNN的特征信息,类似于一种学习多个弱分类模型,将其组合在一起来共同完成任务。

           图1  单向RNN结构图

BiRNN

  BiRNN是指组合两个独立的单向RNN的输出状态ÿ

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值