双语说话者的最近邻分类方法研究
1. 研究背景与相关工作
在语音和说话者识别领域,有许多学者提出了不同的方法和模型。例如,Zhiyuan Tang等人提出了具有协作联合训练框架的多任务循环模型,用于语音和说话者识别,通过协作任务间的信息交互来同时提升各个任务的性能。Eduardo Lleida等人则探讨了说话者识别领域的特殊问题,如欺骗、信道不匹配、欺骗对策和短语音等,还讨论了语音识别领域的最新技术。Ankur Maurya等人提出了使用MFCC - GMM方法对印地语语音信号进行说话者识别,并讨论了识别过程中面临的心理和生理挑战。
2. 提出的方法
为了研究同一说话者语言变化的情况,创建了双语数据集。主要步骤包括提取MFCC特征,并使用以下方法进行分类。
2.1 数据集
为双语说话者和性别识别研究创建了数据集,包含20位说话者,其中10位男性和10位女性。语音样本通过不同的手机在不同环境下采集,以测试模型在不同实时环境中的性能。要求说话者用印地语和英语朗读给定文本。数据集的二维分布展示了性别和说话者识别的MFCC分布情况,如图1所示。
| 类别 | 描述 |
|---|---|
| 性别分类 | 不同颜色代表不同性别的MFCC分布 |
| 说话者分类 | 展示20位说话者的MFCC分布 |
超级会员免费看
订阅专栏 解锁全文
15

被折叠的 条评论
为什么被折叠?



