俄语日常口语高频词序列与儿童情绪状态识别研究
在语言研究和儿童情绪识别领域,有两项重要的研究成果值得关注。一项是关于俄语日常口语中最常见的词序列分析,另一项是印度和俄罗斯专家通过视频和音频模态对俄罗斯儿童情绪状态的识别研究。
俄语日常口语高频词序列研究
在分析俄语口语中词汇和短语的重要性时,研究人员使用了一种度量方法,即通过比较焦点语料库(ORD)和更大的参考语料库(在俄语中为互联网语料库 ruTenTen)来确定关键词。计算公式如下:
[ keyness = \frac{f (focus) + 1}{f (reference) + 1} ]
这个指标能够识别出那些并非在整个语言中普遍频繁出现,但在特定语料库中出现频率较高的词汇和短语。根据这个指标,语料库中最常出现的三元组包括:“YA NE ZNAYU”(我不知道)、“NU V OBSCHEM”(嗯,总的来说)等。这些结果与 n - 元分析得到的结果相近,证实了这些词汇单元在 ORD 语料库中的频率超过了大型中性语料库中的指标,因此它们是口语的特征和标志。
n - 元分析方法在对二元组和三元组进行分类方面非常有效。该技术不仅能深入了解语法结构、口语中的既定结构和语用标记,还为语料库数据分析开辟了许多其他途径。这种方法准确地展示了我们语言中词汇语法和语用单元的比例,以及“重要”和“不重要”实体之间的平衡,这对于全面研究口语交流至关重要。
此外,该方法让我们从一个新的视角观察口语,特别是其语法。我们发现,不仅重要的语法结构或明显稳定的单元值得关注和进行语言描述,常见的词汇序列也同样重要。在口语中,“重要”和“不重要”成分之间的差距虽然在语用或功能上很关键,但如果忽视“不重要”的方面是不合理的。
超级会员免费看
订阅专栏 解锁全文
18

被折叠的 条评论
为什么被折叠?



