树邻接文法(Tree Adjoining Grammars)详解
1. 树语言与串语言的定义
树邻接文法(TAG)用 $G = ⟨N, T, I, A, S⟩$ 表示,其中包含以下重要概念:
- 树语言 :$G$ 的树语言 $LT (G) := {γ | γ$ 是 $G$ 中根标签为 $S$ 的饱和派生初始树 $}$。
- 串语言 :$G$ 的串语言是 $LT (G)$ 中树的产出集合。
2. 形式属性
2.1 语言包含关系
由 TAG 生成的语言类(TAL)恰当地包含所有上下文无关语言(CFL)。因为每个上下文无关文法(CFG)都可视为树替换文法,而树替换文法又是辅助树集合为空的 TAG,所以 CFL 显然包含于 TAL。例如,在之前的例子中,有针对非上下文无关语言的 TAG,像复制语言的 TAG 以及 $L3 := {a^nb^nc^n | n ≥0}$ 的 TAG。
需要注意的是,无邻接约束的 TAG(即邻接操作从不强制,且给定节点的可邻接树集合包含所有具有适当根标签的辅助树)也扩展了 CFG,但比这里定义的有邻接约束的 TAG 能力弱。没有邻接约束时,就无法生成 $L3 = {a^nb^nc^n | n ≥0}$。
2.2 封闭性属性
TAG 形式主义从形式角度具有吸引人的封闭性属性:
- 并运算封闭 :假设两个非终结符集合不相交,将两个文法的初始树和辅助树组合成一个大的 TAG,可证明 TAL 在并运算下封闭。
-
超级会员免费看
订阅专栏 解锁全文
15万+

被折叠的 条评论
为什么被折叠?



