声学场景分类与驾驶语音检测研究
声学场景分类的稀疏表示框架
在声学场景分类领域,稀疏表示框架是一种有效的方法。研究使用了三种不同的稀疏表示分类框架进行实验评估,包括传统的SRC、基于深度学习的DSRC以及提出的DSAE系统。
数据集描述
实验使用了2018、2019和2020年的三个DCASE任务1A ASC开发数据集。这些数据集包含了十种声学场景类别,如机场、地铁、公园等。2019和2020年的数据集涵盖了十个欧洲城市的数据,而2018年的数据集排除了其中四个城市的数据。2020年的数据集还包含了使用多个录音设备捕获的音频记录。
| 年份 | 数据集特点 |
|---|---|
| 2018 | 包含十种声学场景类别,排除四个欧洲城市的数据 |
| 2019 | 包含十种声学场景类别,涵盖十个欧洲城市的数据 |
| 2020 | 包含十种声学场景类别,涵盖十个欧洲城市的数据,包含多个录音设备的音频记录 |
特征提取
使用开源的OpenL3 Python库来获取DCASE数据集音频记录的特征表示。该库包含在Audioset数据集上训练的L3 - Net网络,选择了在环境数据上训练的“env”版本。网络接受原始音频信号作为输入,输出一个512 × 97的
超级会员免费看
订阅专栏 解锁全文
15

被折叠的 条评论
为什么被折叠?



