搭配与统计推断:n - 元语法模型解析
搭配的概念
搭配的概念对于没有语言学背景的人来说可能比较困惑。不同的作者对搭配有不同的定义。在计算和统计文献中,一些作者将搭配定义为两个或更多连续的具有特殊行为的单词序列。例如,Choueka (1988) 认为搭配是“一系列两个或更多连续的单词,具有句法和语义单元的特征,并且其确切和明确的意义或内涵不能直接从其组成部分的意义或内涵中推导出来”。
不过,在大多数面向语言学的研究中,即使短语中的单词不连续,也可以是搭配,如“knock… door”。语言学中处理搭配通常有以下几个典型标准:
1. 非组合性 :搭配的意义不是其组成部分意义的直接组合。要么意义与自由组合完全不同(如习语“kick the bucket”),要么有无法从组成部分预测的内涵或额外意义元素。例如,“white wine”“white hair”和“white woman”所指的颜色略有不同,因此可以将它们视为搭配。
2. 不可替代性 :即使在上下文中其他单词有相同的含义,也不能替换搭配中的组成部分。例如,不能用“yellow wine”代替“white wine”,尽管“yellow”和“white”一样能描述白葡萄酒的颜色(它有点黄白色)。
3. 不可修饰性 :许多搭配不能通过添加额外的词汇材料或进行语法转换来自由修饰。对于像习语这样的固定表达尤其如此。例如,不能将“to get a frog in one’s throat”中的“frog”改为“ugly frog”,尽管通常像“frog”这样的名词可以用“ugly”这样的形容词修饰。同样,将单
超级会员免费看
订阅专栏 解锁全文
837

被折叠的 条评论
为什么被折叠?



