树邻接文法(TAG)及其解析技术详解
1. 树邻接文法(TAG)概述
树邻接文法(TAG)是上下文无关文法(CFG)的一种扩展,具有轻度上下文敏感性。它在自然语言建模中应用广泛,像 XTAG 语法这样的大覆盖实现就表明,许多自然语言现象都能用 TAG 进行充分建模。
TAG 属于树重写文法,与 CFG 不同,它允许更大的基本结构,不仅支持替换操作,还支持邻接操作。TAG 具有一系列良好的形式属性,特别是它是替换封闭的完全 AFL,其语言满足泵引理。从语言学角度看,TAG 的一个关键特性是其扩展的局部性域,这使得它能够对无界依赖进行局部描述。
2. 成分结构与依赖关系
派生树给出了句子的成分结构,而推导树记录了文法的基本树是如何组合在一起以得到派生树的。在词汇化文法中,推导树的每个节点至少对应输入句子的一个词汇项。
假设所有功能元素(补语连词、限定词、助动词、否定词)都是与其关联的词汇项基本树的一部分。在这种假设下,每个替换或邻接操作都对应于一个谓词对其某个参数的应用。因此,推导树给出了句子的谓词 - 参数依赖集,并且推导树接近语义依赖图。
以下是一些示例句子及其对应的基本树和推导树:
- “John buys Bill a book”
- 基本树:包含“John”的 NP 基本树、“buys”的 S 基本树、“Bill”的 NP 基本树和“a book”的 NP 基本树。
- 推导树:以“buys”为根,连接“John”“Bill”和“a book”。
- “John gives a book to Mary”
超级会员免费看
订阅专栏 解锁全文
2759

被折叠的 条评论
为什么被折叠?



