丹麦语 STP 构式的语义与创新用法解析
1. 语料库分析
在语料库研究中,为了比较 be - 和 for - 前缀的语义特征,我们从词频的角度考察了它们在 A 变体中的使用情况。A 变体是一种“带方式说明的及物关系”,由基础动词与前缀结构组合而成。选择聚焦于这一变体,是因为它是最基本且最常见的变体,在历史层面也是如此,并且这两种词缀化形式在该变体中都广泛出现。
1.1 语料来源
本次研究的数据来自 KorpusDK(https://ordnet.dk/korpusdk),这是一个大型的现代丹麦语单语语料库,包含约 5600 万个单词,涵盖了各种书面和口语的文本类型。
1.2 分析方法
对“基础动词” - “前缀”关联的分析结合了标准的词群搭配测度(p 值)和优势比(OR)。在基于用法的语法模型中,使用 p 值作为统计关联频率测度的主要优势在于,它比基于相对频率的简单频率测度(包括 OR)更具优势,因为它对绝对频率敏感。也就是说,在基于用法的语法中,一个动词在某个结构中频繁使用(例如 200 个词例,总体频率为 2000 个词例中的 10%),应比相对频率较高但使用稀少的情况(例如 8 个词例中的 4 个,即 50%)更受重视。不过,用显著性测度(p 值)来评估关联的效应大小是否合适,也存在疑问。而且,当 p 值非常低接近零时,很难区分排名靠前的强关联。这两种测度将频率的各种参数整合到一个单一的关联测度(p 值和 OR 值)中,可用于动词的排名。p 值通过执行费舍尔精确检验(FYE)计算得出,FYE 在词群搭配分析中提供了高度准确且合适的统计关联测度。
1.3 关联排名
在附录 1 和 2
超级会员免费看
订阅专栏 解锁全文
63

被折叠的 条评论
为什么被折叠?



