CHiME系列挑战:自动语音识别的发展与突破
1. CHiME-1和CHiME-2挑战概述
CHiME挑战旨在推动自动语音识别(ASR)技术在复杂噪声环境下的发展。下面分别介绍CHiME-1和CHiME-2的相关情况。
1.1 CHiME-1:小词汇量任务
CHiME-1基于小词汇量的Grid语料库任务,这是一个简单的命令语句任务,最初用于测量人类在嘈杂环境中语音识别的鲁棒性。
- 语料库情况 :语料库包含34位说话者(18男16女),每人说出1000条独特的6词命令,采用简单固定语法。每个语句包含一个字母 - 数字网格参考,这两个词被视为目标关键词,性能以关键词正确率报告。
- 数据划分 :每位说话者的500个语句被指定为训练数据,其余为测试数据。从测试数据中定义了600个语句的测试集(每位说话者约20个语句)。
- 噪声测试语句生成 :将Grid测试集语音与CHiME的双耳房间脉冲响应(BRIR)进行卷积,然后添加到CHiME背景音频的14小时子集中。通过改变时间位置,可获得信噪比(SNR)为 -6、 -3、0、3和6 dB的测试集。
- 训练数据 :参与者获得17,000个语句的CHiME训练集的混响版本,以及额外6小时的背景录音。
1.2 CHiME-2
CHiME-2有两个轨道,分别针对不同的问题进行设计。
Track 1:模拟运动
- 设计目的 <
超级会员免费看
订阅专栏 解锁全文
44

被折叠的 条评论
为什么被折叠?



