八种世界英语变体中进行时的频率
1. 引言
世界英语(World Englishes)是指在全球不同地区使用的英语变体,这些变体在语法、词汇和语音等方面存在差异。进行时(Progressive Aspect)是英语中一个重要的语法特征,它描述正在进行的动作或状态。本篇文章将探讨八种世界英语变体中进行时的使用频率,通过语料库数据分析这些变体之间的差异,并探讨造成这些差异的可能原因。这些变体包括英国英语、美国英语、印度英语、新加坡英语、菲律宾英语、牙买加英语、南非英语和澳大利亚英语。
2. 数据来源与方法
为了准确分析进行时的使用频率,我们使用了国际英语语料库(International Corpus of English, ICE)中的数据。ICE是一个多语言语料库,涵盖了来自不同英语变体的口语和书面语数据。具体来说,我们选择了以下语料库:
- ICE-GB(英国英语)
- ICE-US(美国英语)
- ICE-IN(印度英语)
- ICE-SG(新加坡英语)
- ICE-PH(菲律宾英语)
- ICE-JM(牙买加英语)
- ICE-ZA(南非英语)
- ICE-AU(澳大利亚英语)
2.1 数据处理步骤
- 数据收集 :从每个语料库中随机抽取100万词的文本数据,确保样本的代表性。
- 标注与分类 :使用CLAWS7词性标注器对所有文本进行标注,