自然语言的语法形式体系
上下文无关文法与自然语言
上下文无关文法的生成能力
长期以来,关于上下文无关文法(CFG)是否足以描述自然语言一直存在争议。一些方法使用了 CFG,通常会结合额外的转换机制(Chomsky,1956)或特征(Gazdar 等人,1985)来处理自然语言,这些方法能够处理大量的语言现象。
然而,20 世纪 80 年代,Stuart Shieber 证明了存在一些自然语言无法由 CFG 生成。在此之前,Bresnan 等人(1982)也提出了类似观点,但他们的证明基于 CFG 得到的树结构,而 Shieber 则基于弱生成能力,即字符串语言进行论证。
两篇论文都考虑了交叉序列依赖现象。Bresnan 等人认为 CFG 无法描述荷兰语中的交叉序列依赖,而 Shieber 则指出瑞士德语也存在同样问题。瑞士德语有格标记,因此依赖关系在字符串上可见,从而可以证明其字符串语言不是上下文无关的。
先来看荷兰语的数据:
- 例句(3):… dat Jan de kinderen zag zwemmen(… 那 Jan 看到孩子们游泳)
- 例句(4):… dat Jan Piet de kinderen zag helpen zwemmen(… 那 Jan 看到 Piet 帮助孩子们游泳)
- 例句(5):… dat Jan Piet Marie de kinderen zag helpen leren zwemmen(… 那 Jan 看到 Piet 帮助 Marie 教孩子们游泳)
原则上,可能存在无限数量的交叉依赖。除了第一个和最后一个动词外,名词短语(NPs)和动词的任何排
超级会员免费看
订阅专栏 解锁全文
6302

被折叠的 条评论
为什么被折叠?



