【论文研读总结】基于结构位置的自注意力机制

文章介绍了一种结合自注意力网络(SANs)和结构编码的新方法,通过在依赖树中表示单词间的绝对和相对位置,提升了NIST中文到英语和WMT14英语到德语翻译任务的性能。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

目录

论文简介与作者

一句话简介

作者

摘要概括

区别

符号定义与公式

1.Self-Attention

2.Sequential Position Encoding(顺序位置编码)

关于序列中元素的绝对或相对位置的信息注入SAN

结构位置表述(采用树结构表示)

绝对位置定义

相对位置定义

3.将结构化PE集成到SAN中

绝对位置编码

使用非线性函数来融合序列和结构位置表示

相对位置编码

实验

数据集

实验步骤 

实验结果分析

个人总结

备注

论文简介与作者

一句话简介

SANs(Self Attention Networks, 自注意网络)+结构编码策略

作者

 

摘要概括

SANs(自注意网络),我们使用依赖树来表示句子的语法结构,并提出了两种策略来编码依赖树中单词之间的位置关系。NIST中文版⇒英语和WMT14英语⇒德语翻译任务,绝对和相对顺序位置表示上都能始终如一地提高性能。

句子的潜在结构可以通过结构深度和距离来捕捉(Hewitt和Manning,2019)

---》我们提出了绝对结构位置来编码解析树中每个单词的深度,以及相对结构位置来对树中每个词对的距离进行编码。

区别:

我们将依赖树中的结构信息传输到SANs,深入关联句子内部信息。

符号定义与公式

1.Self-Attention

输入:X=

查询

其中为可训练参数

输出

其中,为点积注意力模型

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值