自然语言处理中的语法形式主义与解析算法
1. 未涉及的语法形式主义
在自然语言处理领域,有几种语法形式主义未被深入探讨。
首先是具有高表达能力的形式主义,如词汇功能语法(LFG)和中心驱动短语结构语法(HPSG)。这些形式主义生成的语言超出多项式范围,与常见语法遵循不同传统。常见语法旨在在保证计算可处理性的前提下,尽可能扩展上下文无关语法(CFG)的表达能力,以描述自然语言现象,而LFG和HPSG本身无法直接刻画自然语言类别。
其次是向量语法,其元素为集合,如重写规则集或树邻接语法(TAG)树集。在推导过程中,使用集合中的一个元素时,其他元素也必须使用。根据元素添加方式的不同,产生了多种具有不同属性的形式主义,如矩阵语法、无序向量语法、树局部和集局部多组件TAG等。
最后是范畴语法,如组合范畴语法(CCG)和抽象范畴语法(ACG)。这些语法基于演绎逻辑框架,与以重写规则为基础的语法不同,本书主要关注重写语法,即规则定义已生成结构部分重写方式的语法,这类语法是CFG的直接扩展。
此外,依存解析也未被涉及。一般来说,依存解析是数据驱动而非规则驱动的,与本书基于规则的符号解析算法采用不同方法。
2. 整体结构概述
整个内容涵盖多个章节,可分为三个主要部分:介绍、CFG扩展及解析算法、自动机模型。
| 章节 | 内容 |
|---|---|
| 第1 - 3章 | 作为介绍,阐述CFG对自然语言的局限性,引入解析的基本概 |
语法形式主义与解析算法综述
超级会员免费看
订阅专栏 解锁全文
9

被折叠的 条评论
为什么被折叠?



