20、循环神经网络在序列到序列任务及翻译中的应用

循环神经网络在序列到序列任务及翻译中的应用

1. RNN 模型训练与性能

在训练初期,模型的稳定性会稍有不足。而到训练后期,训练成本和验证成本显著偏离,模型明显出现过拟合现象。不过,在其最佳性能状态下,模型表现相当出色,在测试集上能达到约 86% 的准确率。这意味着你已经成功构建了第一个循环神经网络(RNN)。

2. 用 RNN 解决序列到序列(seq2seq)任务
  • seq2seq 问题背景 :像将句子中的单词序列映射到词性(POS)标签这样的 seq2seq 任务相对容易处理,因为不需要考虑长期依赖关系来生成合适的标签。但对于语言翻译、视频总结等任务,长期依赖关系对模型的成功至关重要,这时 RNN 就能发挥作用。
  • seq2seq 的 RNN 架构 :该架构类似于自编码器,由编码器网络和解码器网络两部分组成。
    • 编码器网络 :通常是使用长短期记忆网络(LSTM)单元的循环网络,它会处理整个输入序列,目标是对输入形成浓缩理解,并将其总结为编码器网络最终状态所代表的单一“思想”。
    • 解码器网络 :其起始状态由编码器网络的最终状态初始化,然后逐词生成目标输出序列。在每一步,解码器网络将上一步的输出作为当前步的输入。

下面以将英语句子翻译成法语为例,详细说明其工作流程:
1. 对输入的英语句子进行分词,并使用嵌入(类似于之前情感分析模型中的方法),逐词将其作为编码器网络的

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值