15、声学事件分类实验研究

声学事件分类实验研究

1. 实验数据库与协议

本次实验所使用的数据库,涵盖了 2114 个目标事件实例,这些实例分属于 12 种不同的声学类别,具体如下:
- 掌声
- 咳嗽声
- 椅子移动声
- 敲门声
- 关门声
- 键盘打字声
- 笑声
- 纸张包裹声
- 电话铃声
- 脚步声
- 勺子/杯子叮当声
- 钥匙叮当声

整个数据库的构成,旨在与相关研究中的数据库相似。音频文件的来源广泛,包括各类网站、FBK - Irst 数据库以及 UPC - TALP 数据库。用于计算图 1 中语音 SBV 的语音声音,则是从 ShATR 数据库中提取而来。

由于该数据库规模较小,难以得出可靠的分类结果,因此采用了 6 折交叉验证的方法来人为扩展数据库,并在之后对结果进行平均处理。具体操作流程如下:
1. 将数据库划分为六个不相交且平衡的子集。
2. 依次将其中一个子集作为测试集,其余五个子集作为训练集进行模型训练和测试。
3. 重复上述步骤,直到每个子集都作为测试集使用过一次。
4. 对六次测试的结果进行平均。

下面是不同频率尺度下的平均分类率(分段)表格:
| Param. | Scale | Base. | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 |
| — | — | — | — | — | — | — | — | — | — | — | — | — | — | — |
| CC | MEL | 75.10 | 77.4

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值