简单递归上下文无关文法(Simple RCG)的简化与解析
1. 有序简单 RCG
在解析过程中,一般的多成分上下文无关文法(MCFG)通常是无序的,这会使解析变得相当复杂。因为在解析时使用规则,其左侧产生式的输出成分在输入中的顺序不一定与规则中的成分顺序一致。不过,每个简单 RCG(因此每个 MCFG)都可以转换为等价的有序简单 RCG。
1.1 有序简单 RCG 的定义
一个简单 RCG 是有序的,当对于每一个规则 (A(\alpha) \to A_1(\alpha_1) \cdots A_k(\alpha_k)) 以及每一个 (A_i(\alpha_i) = A_i(Y_1, \cdots, Y_{\text{dim}(A_i)}))((1 \leq i \leq k)),(\alpha_i) 在 (\alpha) 中的成分顺序为 (Y_1, \cdots, Y_{\text{dim}(A_i)})。
1.2 转换算法
转换算法的大致步骤如下:
1. 检查每个规则,看右侧谓词之一的成分顺序是否与左侧的成分顺序不对应。
2. 如果不对应,添加一个新的谓词,该谓词仅在成分顺序上与原谓词不同。
3. 用新的谓词替换规则中的原谓词,并对成分进行重新排序。
4. 为每个原谓词规则添加一个副本,将左侧的原谓词替换为新谓词,并对成分进行重新排序。
以下是转换算法的伪代码:
P ′ := P with all predicates A replaced with Aid;
N ′ := {Aid
超级会员免费看
订阅专栏 解锁全文
2213

被折叠的 条评论
为什么被折叠?



