计算机语言学笔记(八)基于上下文无关文法的句法分析

本文介绍了句法分析中的上下文无关文法(CFG),讲解了句法分析的任务是得到自然语言句子的句法结构,通常表示为句法树。讨论了人工语言和自然语言句法分析的区别,特别是自然语言中的歧义问题。提到了Earley算法和LR分析法在句法分析中的应用,以及如何处理分析过程中的多重入口和局部歧义。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

8 基于上下文无关文法的句法分析

句法分析导引
以词为单位的分析技术:词语切分、形态分析、词类标注。
以句为单位的分析技术:句法分析。
以篇为单位的分析技术:指代分析。
句法分析关心句子的组成规律。
句子成分分析
句子是词的线性序列,但词和词之间结合的松紧程度并不一样。
句子在构造上具有层次性,较小的成分还可以进一步组成较大的成分。
不同性质的成分可以有不同的句法功能和分布,可以区分成不同的类型。
短语
英语中的短语:名词性短语(NP),动词性短语(VP),介词短语(PP),形容词性短语。
汉语中的短语:名词性短语(np),动词小短语(vp),形容词性短语(ap),处所词性短语(sp),时间词性短语(tp),数量短语(mp),介词短语(pp)。
句法知识的形式化
上下文无关文法(CFG)是最常用的句法知识形式化工具。
为了便于计算机处理自然语言,计算语言学研究人员提出了许多形式语法系统(grammar formalism),例如:功能合一语法(FUG)、词汇功能语法(LFG)、中心词驱动的短语结构语法(HPSG)等。在这些语法形式化系统中,上下文无关文法是一个核心组成部分。
许多句法分析算法都建立在上下文无关文法的基础上。
上下文无关文法
作为生成装置生成语言中的句子。
作为识别装置判断句子是否合法。
作为分析装置产生给定句子的句法结构。
句法分析
句法分析的任务是对给定自然语言句子,分析并得到其句法结构。
句法结构通常表示为句法树。
人工语言的句法分析
人工语言的特点是无二义性。
存在快速有效的语法分析方法:LL分析法,LR分析法。
自然语言的句法分析
歧义:是指同一个句子,按照指定的文法,会产生多种分析结果。
由于句

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值