DCASE挑战赛中的声音事件检测与定位(SELD)子任务介绍

DCASE挑战赛中的SELD任务关注声音事件的检测与定位,涉及多声道音频输入的处理,旨在识别声音类型并定位其在空间中的位置。此任务有多个迭代,从模拟数据到真实场景记录,不断逼近实际应用的复杂性。DCASE2022使用Sony-TAuRealisticSpatialSoundscapes2022数据集,包含360度视频和空间跟踪信息,推动视听融合的研究。

 DCASE(Detection and Classification of Acoustic Scenes and Events)系列挑战赛包含多个与声音计算相关的子任务,以DCASE2023为例,其包含如下七个与声音计算相关的任务。

 (source:DCASE challenge website) 

声音事件检测与定位作为DCASE挑战赛的子任务已经举办多个轮次。

声音事件检测与定位SELD(Sound Event Localization and Detection)指的是,给定多声道音频输入,声音计算模型为每个目标声音类输出一个时间激活轨迹,当轨迹指示活动时,还输出一个或多个相应的空间轨迹。

声音事件检测与定位系统可以用于广泛的机器认知任务,如识别环境类型、定位、在没有视觉输入或是视觉遮挡情况下进行导航、跟踪特定类型的声源、智能家居、场景可视化和声学监测等。

1、任务介绍

SELD任务可以描述为下图,针对给定的通道声音数据,采用声学计算模型(sound event localization and detection system)同时检测该时序信号中包含的声音事件类型,并在它们出现的时候定位其在空间中的位置(这里估计的是角度azimuth和elevation)。

(source:DCASE challenge website) 

2、挑战赛发展历程

DCASE2023(DCASE2023 Challenge - DCASE)是SELD子任务的第5次迭代。前3个挑战是基于模拟的多通道记录,由事件样本库生成,这些样本库包含在不同房间捕获的空间房间脉冲响应(spatial room impulse responses, SRIRs),并混合了在相同位置记录的空间环境噪声。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值