范围连接文法(Range Concatenation Grammars)的深入解析
1. 范围连接文法基础
范围连接文法(RCG)所生成的字符串语言集合恰好是所有多项式语言的类别。存在多项式解析算法证实了每个由 RCG 生成的语言都是多项式的。而要证明所有多项式语言都包含在 RCG 字符串语言集合中,可通过为给定的具有 k 个头的双向交替有限自动机构造一个等效的 RCG 来实现。这种自动机是非确定性的,会在存在分支状态(只需一种可能性成功)和通用分支状态(所有可能性都必须成功)之间交替。在对应的 RCG 中,前者由一组不同的子句建模,后者则由右侧包含所有可能性对应谓词的单个子句建模。
2. 范围连接文法的应用
2.1 超越线性上下文无关递归文法(LCFRS)的现象
自然语言中,LCFRS 通常无法处理的一种现象是无界乱序,如德语和其他自由词序语言中存在的情况。以德语句子为例:
- “… dass er den K¨uhlschrank seinem Freund zu reparieren zu versprechen versucht”
- “… dass er seinem Freund den K¨uhlschrank zu reparieren zu versprechen versucht”
在只考虑带单个参数的无限动词的假设下,会出现一种通用配置:k 个名词短语后跟着 k 个动词,每个名词短语依赖于一个动词,动词顺序固定,但名词短语可以任意排列。为此提出了一种形式语言:所有字符串 π(n[1] … n[m])v[1] … v[m](m ≥ 1,π 是排列,n[i] 是 v[i] 的名词参数,1 ≤ i
超级会员免费看
订阅专栏 解锁全文
1378

被折叠的 条评论
为什么被折叠?



