一、文章主要内容
该研究基于大型语言模型(LLM)标注的英汉语可比新闻语料库,从具有状语角色的功能块视角,探究英汉语新闻在语序上的差异,分析其典型位置偏好与分布模式,具体内容如下:
(一)研究背景与问题提出
- 语序差异的现实挑战:英汉语在传递时间、地点、方式等状语信息时语序差异显著,给二语学习(如学习者难以准确判断成分位置)和翻译(如需调整语序以保证信息有效传递)带来困难。
- 现有研究不足:以往研究多从特定语法单位切入,侧重句法分析却忽视语义信息传递;方法上依赖归纳推理和主观判断,数据有限且缺乏普遍模式的实证支持;研究重点多放在影响语序差异的因素上,对语序本身的分布模式关注较少。
- 研究契机:随着GPT - 4等大型语言模型的发展,语料库中“功能块”的自动标注成为可能,为大规模语序模式分析提供了高效工具,故本研究采用数据驱动方法探究英汉语新闻语篇中状语功能块的分布模式。
(二)研究设计
- 研究问题
- 不同类型功能块的语序偏好是什么?
- SVO与功能块组合中的语序趋势如何?
- 多个功能块共现时的排序倾向怎样?
- 语料来源与标注:采用CROWN2021(美式英语平衡语料库,约90131词)和ToRCH2019(现代汉语平衡语料库,约885
订阅专栏 解锁全文
2202

被折叠的 条评论
为什么被折叠?



