2、自然语言处理中的语法形式主义与解析算法综述

自然语言处理中的语法形式主义与解析算法综述

1. 不涉及的语法形式主义

在自然语言处理领域,有几种语法形式主义在相关研究中被搁置一旁。

首先是具有高表达能力的形式主义,它们会生成超多项式语言。其中最突出的是词汇功能语法(LFG)和中心驱动短语结构语法(HPSG)。与常见的语法不同,它们遵循不同的传统。常见语法旨在在保证计算可处理性的前提下,尽可能扩展上下文无关文法(CFG)的表达能力,以描述自然语言现象,而LFG和HPSG提供的形式主义过于强大,本身并不能告诉我们关于自然语言类别的信息,只有具体的语法才能刻画自然语言。

其次是向量语法。它的元素是集合,如重写规则集或树邻接文法(TAG)树集。在推导过程中,使用集合中的一个元素时,必须同时使用该集合中的其他元素。根据元素添加方式的不同,会产生多种具有不同属性的形式主义,例如矩阵文法、无序向量文法、树局部和集局部多组件TAG、带支配链接的非局部MCTAG和带支配链接的向量TAG。

最后是范畴语法,如组合范畴语法(CCG)和抽象范畴语法(ACG)。这些语法的定义方式与常见的语法形式主义不同,因为范畴语法是基于演绎的逻辑框架,而常见研究集中在重写语法上,即规则定义已生成结构部分重写方式的语法,它们是CFG的直接扩展。

此外,依存解析也是被搁置的重要话题。一般来说,依存解析是数据驱动而非规则驱动的,与基于规则的符号解析算法采用不同的解析方法。

2. 整体内容概述

整体内容涵盖了多个方面,包括自然语言的语法形式主义、解析的预备知识、不同的语法扩展及其解析算法,以及自动机模型。

2.1 自然语言的语法形式主义

CFG在

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值