自然语言形式化中的句法与转换分析
1. 句法分析基础
句法分析在自然语言处理中起着关键作用。解析树代表了语法的结构,但并非句子的结构。例如,一个简单的及物句子,其解析树体现的是语法规则的组织,而非句子本身的语义结构。当对语法进行修改时,像细化限定词的形式化表达,原本单一的 DET 图可能会被多个嵌入图替代,如 DDef(如“the”)、DDem(如“this”)、DNoun(如“the majority of”)、DAdv(如“a lot of”)以及用于前置限定词的 DPred 图(如“all”)等。
如果要将语法适配到特定的自然语言处理应用中,如从土木工程的官方提案请求中提取日期,就需要对语法进行重构,区分非正式日期(如“three months after my birthday”)和正式日期(如“three months after the acceptation of this estimate”)。此外,NooJ 会自动对语法进行优化,包括使图具有确定性、用对应词形替换词汇符号、处理拼写变体、去除左右递归以及让语法更紧凑等。
为了使语法生成的句子结构独立于语法自身结构,文本的句法结构通过语法生成的结构化注释来表示,与语法的组织方式无关。这一特性在大规模语言描述项目中至关重要,因为这类项目需要积累大量结构不稳定的语法。
2. 依赖语法与依赖树
依赖语法是一种特殊的语法形式。以图 12.10 所示语法的一个变体为例,它结构相同但生成不同的结构化注释。该语法不注释句子成分(如主语、动词或宾语),而是注释语义谓词,包括动词和名词。
在这个语法中,$V 在 VG 图中定义,取当前命题的主要动词值,$V_ 生成其词元
超级会员免费看
订阅专栏 解锁全文
2602

被折叠的 条评论
为什么被折叠?



