14、自然语言形式化:上下文无关与上下文相关语法解析

自然语言形式化:上下文无关与上下文相关语法解析

1. 上下文无关语法

1.1 递归类型

  • 左递归 :像 “The pen” “The pen in the box” “The pen in the box inside the drawer” 这样的结构,可以构建与之等价的有限状态图。并且,从上下文无关语法中移除左递归的过程可以自动化。
  • 中间递归 :存在一种更复杂的递归形式,它既不在语法的左侧也不在右侧。例如 “The cat sleeps” “The cat that Joe got sleeps” 这类句子。不过,使用中间递归生成的嵌套句子通常不太自然,超过两三层嵌套后,句子就难以被接受。而且,无法构建与包含中间递归的上下文无关语法等价的正则表达式。

1.2 解析树

当应用语法解析文本时,通常会得到一个二元结果:文本序列是否属于该语法描述的语言。但这种二元信息往往不够,尤其是对于结构有歧义的句子。例如 “This man sees a chair from his house” 这个句子,使用给定的歧义语法解析时,会有两种可能的推导:
- 第一种推导
- Main → NP NP→ This man sees NP → This man sees NP from NP→ This man sees a chair from NP → This man sees a chair from his house
- 此时 “sees” 只有一个直接宾语,可能的

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值