【每周一文】Sequence to Sequence Learning with Neural Networks(2014)

本文介绍了Sequence to Sequence Learning with Neural Networks模型,用于处理序列到序列任务,如机器翻译、语音识别等。Seq2Seq模型由编码和解码两部分组成,其中编码器将输入序列转化为固定长度向量,解码器根据此向量生成输出序列。文章讨论了不同的编码器(如RNN、LSTM、GRU)和解码器(如RNN、Attention Model)选项。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

概述

DNN已经被成功用于多种AI任务,并取得很多可喜的成绩,例如语音识别、图片分类等。然而它们都不能处理序列到序列的任务,该文提出了一个端到端的(End To End)模型处理序列到序列的任务。
本文主要介绍:

1.Seq2Seq任务描述
2.Seq2Seq模型介绍

任务描述

在自然语言处理中有很多任务都可以归约为序列到序列的任务,例如:
1.机器翻译问题
2.语音识别
3.图片添加注释
4. 问答系统
5. 文本摘要

这些问题都1)输入和输出可能都是不同领域2)输入和输出可能长度不一致。

该文提出的Seq2Seq的模型能够处理上述问题,并且能够端到端处理不需要额外其他操作。

Seq2Seq模型

模型简单描述如下:
这里写图片描述

1.其中序列ABC是输入序列,WXYZ是输出序列,EOS是结束符号
2.模型分为两个阶段1)encode阶段,该阶段将输入序列编码成一个定长维度的向量2)decode阶段,根据编码后向量预测输出向量。
3.编码过程,可以使用标准的RNN模型,例如

htyt=f(
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值