自然语言形式化:上下文无关与上下文相关语法解析
1. 上下文无关语法
1.1 递归类型
- 左递归 :像 “The pen” “The pen in the box” “The pen in the box inside the drawer” 这样的结构,可以构建与之等价的有限状态图。并且,从上下文无关语法中移除左递归的过程可以自动化。
- 中间递归 :存在一种更复杂的递归形式,它既不在语法的左侧也不在右侧。例如 “The cat sleeps” “The cat that Joe got sleeps” 这类句子。不过,使用中间递归生成的嵌套句子通常不太自然,超过两三层嵌套后,句子就难以被接受。而且,无法构建与包含中间递归的上下文无关语法等价的正则表达式。
1.2 解析树
当应用语法解析文本时,通常会得到一个二元结果:文本序列是否属于该语法描述的语言。但这种二元信息往往不够,尤其是对于结构有歧义的句子。例如 “This man sees a chair from his house” 这个句子,使用给定的歧义语法解析时,会有两种可能的推导:
- 第一种推导 :
- Main → NP NP→ This man sees NP → This man sees NP from NP→ This man sees a chair from NP → This man sees a chair from his house
- 此时 “sees” 只有一个直接宾语,可能的
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



