13、依赖解析、语法网络与循环神经网络在序列分析中的应用

依赖解析、语法网络与循环神经网络在序列分析中的应用

1. 依赖解析与线性化

依赖解析旨在构建句子中单词之间的关系映射,形成依赖解析树。例如,在句子中“我”和“出租车”分别是“乘坐”这个动词的主语和直接宾语,它们在依赖解析树中作为“乘坐”的子节点。

将树结构表示为序列的一种方法是线性化。对于一个有根节点 R 以及子节点 A、B、C(分别通过边 r_a、r_b、r_c 连接)的图,可将其线性表示为 (R, r_a, A, r_b, B, r_c, C)。对于更复杂的图,若节点 B 还有子节点 D 和 E(分别通过边 b_d、b_e 连接),则可表示为 (R, r_a, A, r_b, [B, b_d, D, b_e, E], r_c, C)。

把依赖解析问题看作一个序列到序列(seq2seq)问题时,即读取输入句子并输出表示其依赖解析线性化的标记序列。然而,这与之前词性标注(POS tagging)问题不同,词性标注中单词和词性标签有明确的一对一映射,且可通过上下文确定词性。但在依赖解析中,句子中单词的顺序与线性化标记的顺序没有明确关系,还需要识别可能跨越大量单词的边,这似乎违背了不考虑长期依赖的假设。

2. 弧标准系统

为了更易于处理依赖解析问题,可将其重新视为寻找一系列有效“动作”以生成正确依赖解析的过程,这就是弧标准系统。

在弧标准系统中,首先将句子的前两个单词放入栈中,其余单词放在缓冲区。在每一步,有三种可能的动作:
- SHIFT :将一个单词从缓冲区移动到栈的前端。
- LEFT ARC :将栈前端的两个元素合并为

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值