paper解读：Dictionary-Guided Editing Networks for Paraphrase Generation

最新推荐文章于 2024-12-09 10:43:44 发布

原创最新推荐文章于 2024-12-09 10:43:44 发布 · 864 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

paper解读专栏收录该内容

10 篇文章

订阅专栏

本文深入解析了谷歌于2017年发布的复述生成技术论文，介绍了一种在encoder-decoder框架中加入字典指导编辑网络的方法，用于生成语法正确且意义保持不变的复述句子。文章详细阐述了检索、字典编码及字典指导编辑模型的实现过程。

突发奇想，突然想把自己阅读后的paper整理下来，整理自己思路的同时也可以方便有需要的读者阅读，感觉这应该是个好习惯hhh…

今天要讲解的是谷歌在17年发表的关于复述生成的一篇论文:
Dictionary-Guided Editing Networks for Paraphrase Generation

什么是复述生成呢？简单来说就是一个句子经过复述后，跟原来的句子在表达形式上有所区别，但是表达的是相同的意思，而且复述的句子还要保证语法通顺。
举个例子：
原句子：“你很漂亮”；
复述句子：“你长得好好看”。

这篇论文的主要贡献为：在encoder-decoder框架中加入字典指导的编辑网络，如下图，右边的词或短语的复述对就是作者引入的外部信息：
在这里插入图片描述
第一步：检索

作者引入外部数据库：Paraphrase Database (PPDB)来获取词或短语的复述对；
使用Lucene工具在PPDB中检索原句子中词或短语的复述对（10倍复述对），然后对这些复述对进行排序，排序算法如下：

这里作者先使用Lucene工具默认的排序工具检索出10倍复述对，然后再使用自己的排序算法取出top M个复述对，排序算法第一项为原始词或短语的tfidf值，表征该短语的整个句子中的重要程度；第二项为复述对的得分函数，可以理解为两个复述短语的语义相似程度。

第二步：字典编码
得到原始句子x的复述对 $\varepsilon=\{(o_i,p_i)\}_{i=1}^M$ 之后，使用字典编码网络将 $\varepsilon$ 转换为表示向量：
在这里插入图片描述

第三步：字典指导的编辑模型

对于原始输入句子，作者使用BiRNN和标准的attention模型提取有效信息:
对于表示向量，作者使用soft attention来判断词是否删除或插入:

具体的soft attention模型如下：

通过 $c_t$ 向量来判断词是否删除或插入。

以上，就是整篇文章的大致流程，paper中的结构图如下：
在这里插入图片描述
但其实这个图作者是省略了一些步骤的，具体为隐藏层省略了一层，更具体的应该为：

画的有点丑，将就着看吧…

以上内容，若理解或表达有误，请不吝赐教！

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。