多上下文无关树文法与多组件树邻接文法解析
1. 引言
在计算语言学领域,为了生成上下文无关语言的半线性超类、模拟交叉序列依赖关系,同时保证在多项式时间内可解析,人们提出了多种文法形式。其中,较为知名的有(集局部)多组件树邻接文法(MCTAG)和多上下文无关(字符串)文法(MCFG)。MCTAG 是树邻接文法(TAG)的扩展,而 MCFG 则是独立发现的基于字符串的线性上下文无关重写系统(LCFRS)。多上下文无关树文法(MCFTG)是在这两种文法的基础上发展而来,它本质上是一种基于树的线性上下文无关重写系统。
2. 预备知识
- 基本符号定义 :
- 正整数集用 (N = {1, 2, 3, \ldots}) 表示,(N_0 = N \cup {0})。对于 (k \in N_0),([k] = {i \in N | i \leq k})。集合 (A) 的基数记为 (|A|),(A^* = \bigcup_{n \in N_0} A^n),(A^+) 表示 (A) 的正闭包。
- 对于序列 (w = (a_1, \ldots, a_n) \in A^n),(occ(w) = {a_1, \ldots, a_n}) 表示序列中出现的元素集合。若序列中元素不重复,则称该序列为无重复序列。序列的连接运算 (w \cdot v) 定义为 (w) 和 (v) 的元素依次连接。
- 对于子集 (B \subseteq A),序列 (w) 关于 (B) 的产率 (yd_B(w)) 是通过从 (w) 中移除所有不在 (B) 中的符号得到的 (B^*) 中的序列。
超级会员免费看
订阅专栏 解锁全文
19

被折叠的 条评论
为什么被折叠?



