竞赛介绍
随着汽车逐渐成为人们日常生活中不可或缺的一部分,大家也开始追求更加舒适安全的驾驶环境。传统座舱的人机交互以触控为主,容易分散司机注意力,从而带来风险,于是智能座舱的概念逐渐兴起。
智能座舱的目的是通过支持语音、手势在内的多模态交互,给用户提供一个更加安全舒适的驾驶体验,因此,一个鲁棒的语音识别系统对于智能座舱来说是非常重要的。尽管近年来,语音识别技术取得了很大的发展,但是在智能座舱场景下,仍然存在很多挑战。首先,座舱的声学环境特殊,汽车腔体封闭,而且存在包括媒体广播、风噪、人声在内的各种噪声干扰,其次智能座舱语音识别的内容以指令为主,包括设备控制、导航、多媒体交互等,以短句为主,涉及到大量的命名实体。
当前语音识别领域有大量的开源数据,并且使用开源数据训练的模型在很多任务上都取得了较好的效果,但是这些模型在智能座舱场景下往往会因为特殊的声学环境和语言领域特性而无法取得理想的效果。因此,我们在中文口语语言处理国际会议(The 13th International Symposium on Chinese Spoken Language Processing, ISCSLP 2022)上发起了智能座舱语音识别挑战赛(Intelligent Cockpit Speech Recognition Challenge, ICSRC),在这次竞赛中我们将发布20小时真实智能座舱录制的语音数据,覆盖丰富的驾驶场景,促进智能座舱场景下的语音识别技术的研究与交流。
ISCSLP 2022 将于今年 12月11 - 14日在新加坡举办,会议采用线下和线上相融合的方式,会议上将举办本次竞赛的 Session 和颁奖环节。
赛道安排和评价指标
本比赛设置两个赛道,两个赛道对于模型大小有不同的限制。
Track I (模型受限赛道): 模型参数量不得超过15M,如果系统包

ISCSLP2022发起智能座舱语音识别挑战,旨在提升车载环境下的语音识别技术。比赛设有模型大小受限和不限制的两个赛道,使用字错误率作为评价标准。提供20小时真实座舱数据,涵盖多种驾驶场景。参赛者需遵循数据增强、模型训练等规则,优胜队伍将有机会发表论文并参与会议。
最低0.47元/天 解锁文章
1051

被折叠的 条评论
为什么被折叠?



