依存句法分析—A Fast and Accurate Dependency Parser using Neural Networks

最新推荐文章于 2024-09-13 00:45:00 发布

原创

最新推荐文章于 2024-09-13 00:45:00 发布 · 4.5k 阅读

16 ·

CC 4.0 BY-SA版权

文章标签：

#依存句法分析 #transition-based dependency pa #LEFT-ARC #RIGHT-ARC

本文介绍了一种使用神经网络进行依存句法分析的方法，通过transition-based贪心模型解决传统方法的不足，提高准确率并加快速度。尽管只预测了LEFT-ARC, RIGHT-ARC, SHIFT中的转换，未预测依赖关系标签，但有助于理解特征处理和模型过程。" 133150032,20038014,Cadence Allegro：网络环路报告的生成与导出,"['PCB设计', '电路分析', '信号处理', 'Allegro软件', '电子工程']

一、问题描述

这是一篇使用神经网络来做依存句法分析的经典文章，传统的依存句法分析特征向量稀疏，特征向量泛化能力差，特征计算消耗大，用神经网络做transition-based贪心模型可以缓解上述问题，准确率提高，速度变快。由于源代码是java写的，所以本人看了用tensorflow改写的代码，但是该代码存在一些问题，只预测是LEFT-ARC，RIGHT-ARC，SHIFT中的一种（即三分类），但没有预测ARC是哪种依赖关系（label），也就是只预测unlabeled attachment scores(UAS)，不能预测labeled attachment scores(LAS)，但是有助于特征处理以及整个模型过程的理解，看不懂论文和博客的建议看一下代码。

二、transition-based dependency parser

首先每一个决策过程都是基于当前的状态（configuration）做的决策（transition），做好transition后更新configuration进入下一步决策过程中，做决策时采用贪心算法哦，就是每一步都选择当前认为最好的transition就行，这样只损失了一丢丢准确率，换来了速度的大幅度提升。

configuration： $c=\left ( s, b, A \right )$ ， $s$ 是一个栈（stack）， $b$ 为缓存队列（buffer）， $A$ 为当前已经画好的依赖弧线集合（dependency arcs），假设一个句子为 $w_{1},w_{2},\cdots ,w_{n}$ ， $w_{n}$ 为句子中的单词哦，初始configuration为 $s=\left [ ROOT \right ]$ ， $b=\left [w_{1},w_{2},\cdots ,w_{n} \right ]$ ， $A=\varnothing$ ，如果一个configuration的buffer是空的，且 $s=\left [ ROOT \right ]$ ，则这是最后一个configuration，即终点状态哦，即结束整个决策过程了哦。

transition：有三种，LEFT-ARC，RIGHT-ARC，SHIFT。下面详细介绍，先用 $S_{i}$ 代表stack的第几个top元素（注意栈的先进后出哦，是按出的顺序算第几个的），用 $b_{i}$ 对应buffer中的第几个元素（队列先进先出，是按出的顺序算第几个的），则

$LEFT-ARC\left ( l \right )$ ：当stack中元素个数大于等于2时，添加一个dependency arc为 $S_{1}\rightarrow S_{2}$ ，且该arc对应的依赖关系（label）为 $l$ ，然后将 $S_{2}$ 从stack中移除。

$RIGHT-ARC\left ( l \right )$ ：当stack中元素个数大于等于2时，添加一个dependency arc为 $S_{2}\rightarrow S_{1}$ ，且该arc对应的依赖关系为

最低0.47元/天解锁文章

5 条评论

shiyu112358 2019.08.04
博主您好，想请教为什么在dependency parsing中需要指明si的最左和最右孩子，以及孩子的最左和最右孩子呢？
- TangTangzuoli回复shiyu112358 2020.10.02
  这个只是一个特征，作者认为这个特征是相对比较重要的吧。一定会存在论文中的incomplete的问题的

csdnfala 2019.07.08
可否分享一下源码链接 tf版本的链接也请分享一下？
- qq_30696249回复爱看球的领带 2019.12.30
  [reply]jzlixiao[/reply] 请问，有没有预测ARC是哪种依赖关系代码
- 爱看球的领带回复csdnfala 2019.11.16
  [reply]csdnfala[/reply] https://github.com/akjindal53244/dependency_parsing_tf 不知作者有没有改出来：“但没有预测ARC是哪种依赖关系（label）” 希望交流一下，我最近用pytorch写了模仿了一版，也是有bug