NLP学习记录——句法分析

本文探讨了句法分析的两个主要方向:成分句法分析(CFGs)和依存分析。介绍了CFGs的基本概念、PCFGs的概率模型以及解决歧义的方法,并提到了基于转移的依存分析在依存关系树构建中的应用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

句法分析

一般而言,句法分析分为两个主要的方向:
一是句法结构分析,或称成分句法分析、短语句法分析,亦即context-free grammers(CFGs),将语句视为嵌套的短语组合:
Basic unit: words
the, cat, cuddly, by, door
det, N, Adj, P, N
Words combine into phrases
the cuddly cat, by the door
NP -> Det Adj N,PP -> P NP
Phrases can combine into bigger phrases
the cuddly cat by the door
NP -> NP PP
使用语法树表示更为方便:
这里写图片描述
一是依存分析,研究单词之间的依赖关系:
这里写图片描述
同样,依存关系也适于用树来表达:
这里写图片描述
首先来看看CFGs。

CFGs

CFGs的定义包括四个集合:
N:有限的非终端语法标识的集合,亦即语法树上非叶子结点的集合。
S:起始标识
E:有限的终端标识集合,也是语句中所有单词的集合,位于句法树的叶子结点。但是要注意,句法树的叶子节点允许为空。
R:构建句法树的有限个规则的集合,表述了句法树的构建过程。
即G=(N,E,S,R)
例:
这里写图片描述
基于以上集合可构建句法树:
这里写图片描述
但是,构建过程也可能会有歧义:
这里写图片描述
left-most derivation是句法树构建过程中的一串序列,例:
s1=S
s2=NP VP.(基于规则s->NP VP)
s3=DT NN VP(nP->DT NN)
s4=the NN VP(DT->the)
s5=the man VP(NN->man)
s6=the man Vi(VP->V

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值