MCFG解析算法与简单RCG简化方法
1. MCFG的CYK解析
1.1 基本算法问题与改进思路
在解析多成分上下文无关文法(MCFG)时,最初采用的完全无约束预测策略会预测所有能找到终端范围的规则可能被使用,这会产生大量不必要的预测。可以通过更智能的预测策略来改善,如自顶向下预测(Earley)或左角预测。
基本算法存在一定问题,而改进后的算法在完成操作时,仅将一个已完成的谓词与一个活动项组合。然而,已完成的谓词有 dim(Bk) 个范围,所以即使是更二元化的完成操作,也会将 2dim(Bk) 个范围边界与活动项组合,每个边界的值在 0 到 n 之间。为避免这种情况,需要寻找新的策略,如后续介绍的活动算法。
1.2 活动算法
活动算法的核心思想是使用点来遍历范围约束向量 φ,从左到右处理左侧产生式的不同部分。移动点越过终端意味着扫描下一个输入符号,移动点越过变量 A(i) 表示存在一个 A 谓词,其第 i 个组件允许此移动。在移动点的过程中,将终端和组件变量 A(i) 替换为适当的范围。
1.2.1 活动项和被动项的形式
- 被动项形式为
[A, ρ]。 - 活动项形式为
[A →f[B]; (φ, ρ • x, ψ); Γ],其中:- φ 是范围列表。
- ρ 是
超级会员免费看
订阅专栏 解锁全文
7

被折叠的 条评论
为什么被折叠?



