印度英语发音变异性研究
一、引言
印度是一个语言高度多样化的国家,拥有超过 1369 种母语。这些母语丰富的元音和辅音系统对印度英语(IE)的发音产生了显著影响。这种影响给印度语境下的自动语音识别(ASR)和文本转语音(TTS)合成系统带来了挑战,可能导致系统性能下降,原因之一是缺乏标注的印度英语语音发音数据。
为了更好地进行非母语语言的发音建模,需要考虑说话者母语的特征。印度本土语言与英语在音素库存上的差异,使得印度非英语母语者倾向于将英语音素映射到母语中最接近的音素。因此,研究印度英语的发音在语音层面上对于改善印度说话者的语音系统至关重要。
以往的研究存在一些不足,缺乏对大量多样化印度英语发音变异性数据集的数据分析。定性观察虽然有一定价值,但缺乏定量指标来揭示这些观察的普遍性和重要性。为了填补这些空白,我们使用 Indic TIMIT 语料库进行数据驱动的分析,收集现有相对于标准发音(RP)的定性语音规则,并报告定量指标,同时提出新的规则,并验证这些规则在构建印度英语发音自动生成的字母到音素(G2P)转换系统中的有效性。
二、数据标注与预处理
2.1 Indic TIMIT 语料库
我们使用 Indic TIMIT 语料库的语音数据。该语料库选取了来自印度 6 个地区(东北、东部、北部、中部、西部和南部)的 80 位印度英语二语学习者。每位说话者朗读 TIMIT 刺激材料,共录制 2342 个刺激,年龄范围在 18 - 60 岁之间,累计获得 240 小时的语音数据。
根据说话者母语的地区,将这 6 个地区分为 5 个组,每组 16 人,且男女平衡:
- 第 1 组(东北和东部地
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



