NLP - 依存句法分析、句子歧义

本文讨论了语言结构的两种主要观点:短语结构语法和依存结构。前者如上下文无关文法(CFGs)描述嵌套短语,后者通过词与词之间的关系直接表示句子结构。文章介绍了如何处理非投影性,以及依赖句法分析方法,如动态规划、图算法和机器学习驱动的解析器,如MaltParser和transition-basedparsing的应用。

1. 语言结构的两种观点

  1. Constituency = phrase struct grammar = context-free grammars(CFGs)
  2. Dependency structure

对于context-free grammars(CFGs)

短语结构(Constituency):短语结构语法是一种描述语言结构的方法,它将句子划分为短语(phrase)的组合。根据短语结构语法的观点,句子由短语构成,而这些短语又由更小的短语或单词组成。

  • words−>phrases−>biggerphraseswords -> phrases -> bigger phraseswords>phrases>biggerphrases

上下文无关文法(CFGs):上下文无关文法是一种形式化的语法模型,用于描述一类语言的结构(嵌套短语)。它基于一组规则,其中每个规则指定了一个非终结符(可以被进一步展开的符号)如何被替换为终结符(不可再展开的符号)或其他非终结符。

  • 举例:举例:举例:
    Expr−>Expr+ExprExpr -> Expr + ExprExpr>Expr+Expr
    Expr−>Expr∗ExprExpr -> Expr * ExprExpr>ExprExpr
    Expr−>(Expr)Expr -> (Expr)Expr>(Expr)
    Expr−>numExpr -> numExpr>num

在这里插入图片描述
在这里插入图片描述

Det 指的是 Determiner, 在语言学中的含义为 限定词
P 指的是 Preposition,在语言学中的含义为 介词

NP 指的是 Noun Phrase, 在语言学中的含义为 名词短语
VP 指的是 Verb Phrase, 在语言学中的含义为 动词短语
PP 指的是 Prepositional Phrase, 在语言学中的含义为 介词短语

举例:

在这里插入图片描述

总结:

在自然语言中,将句子处理为constituency gr

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值