20、自然语言形式化中的句法与转换分析

自然语言形式化中的句法与转换分析

1. 句法分析基础

句法分析在自然语言处理中起着关键作用。解析树代表了语法的结构,但并非句子的结构。例如,一个简单的及物句子,其解析树体现的是语法规则的组织,而非句子本身的语义结构。当对语法进行修改时,像细化限定词的形式化表达,原本单一的 DET 图可能会被多个嵌入图替代,如 DDef(如“the”)、DDem(如“this”)、DNoun(如“the majority of”)、DAdv(如“a lot of”)以及用于前置限定词的 DPred 图(如“all”)等。

如果要将语法适配到特定的自然语言处理应用中,如从土木工程的官方提案请求中提取日期,就需要对语法进行重构,区分非正式日期(如“three months after my birthday”)和正式日期(如“three months after the acceptation of this estimate”)。此外,NooJ 会自动对语法进行优化,包括使图具有确定性、用对应词形替换词汇符号、处理拼写变体、去除左右递归以及让语法更紧凑等。

为了使语法生成的句子结构独立于语法自身结构,文本的句法结构通过语法生成的结构化注释来表示,与语法的组织方式无关。这一特性在大规模语言描述项目中至关重要,因为这类项目需要积累大量结构不稳定的语法。

2. 依赖语法与依赖树

依赖语法是一种特殊的语法形式。以图 12.10 所示语法的一个变体为例,它结构相同但生成不同的结构化注释。该语法不注释句子成分(如主语、动词或宾语),而是注释语义谓词,包括动词和名词。

在这个语法中,$V 在 VG 图中定义,取当前命题的主要动词值,$V_ 生成其词元

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值