音源分离|数据集|MUSDB18-HQ

一、说明

        MUSDB18-HQ是MUSDB18数据集的未压缩版本。它由总共150首不同风格的完整歌曲组成,包括立体声混音和原始源,分为训练子集和测试子集。

        其目的是作为设计和评估源分离算法的参考数据库。这种信号处理方法的目的是从一组混合物中估计一个或多个源,例如用于卡拉ok应用。

        MUSDB18-HQ包含两个文件夹,一个文件夹包含由100首歌曲组成的训练集:“train”,另一个文件夹包含由50首歌曲组成的测试集:“test”。监督方法应该在训练集上进行训练,并在两个集上进行测试。

        数据集对应的文件结构如下所示。所有音频都是44.1KHz。

二、数据集下载链接

        点击链接MUSDB18-HQ - an uncompressed version of MUSDB18

<think>好的,我需要帮助用户寻找声源数据集的相关信息,包括下载、使用和评测。首先,我需要回顾用户之前的对话和提供的引用内容,看看是否有相关的数据集信息。 用户之前的问题是关于DeepFilterNet2和WebRTC的性能对比,但现在转向了寻找声源数据集。用户提供的引用中提到了几个数据集,比如DSD100、GTZAN、BEWO-1M,还有SELD2022挑战赛的数据集。这些可能都是相关资源。 首先,我应该整理这些引用中的数据集信息。引用[1]提到SELD2022挑战赛的数据集,涉及声音事件定位和检测。引用[2]详细介绍了DSD100数据集,用于声音分离,特别是音乐分离任务。引用[3]提到了GTZAN数据集,用于节拍检测,可能包含音乐片段。引用[4]介绍了BEWO-1M,一个带有空间描述的双通道音频数据集。引用[5]涉及语音识别测试,但可能相关性较低。 接下来,用户需要下载、使用和评测这些数据集的信息。我需要确保每个数据集的描述中包含这些方面的内容。例如,DSD100的下载地址、使用场景(如音乐分离)、评测指标(如SDR)。同样,其他数据集也需要类似的信息。 此外,用户可能还需要其他常用的声源数据集,比如LibriSpeech、UrbanSound8K、TUT Sound Events等。这些数据集在语音识别、环境声音分类等领域常用,应该补充进去。 需要注意引用格式,每个数据集后面加上对应的引用标记。例如,DSD100在引用[2]中提到,所以标注[^2]。SELD2022的数据集在引用[1],所以标注[^1]。GTZAN在引用[3],BEWO-1M在引用[4]。 用户可能需要评测方法,所以需要包括常用的评测指标,如SDR、SI-SDR、PESQ等,并说明这些指标适用的任务,如分离、增强、识别等。 最后,生成的相关问题需要围绕数据集的选择、使用、评测工具展开,确保覆盖用户可能进一步的需求。 需要检查每个数据集的描述是否准确,特别是根据用户提供的引用内容。例如,DSD100的数据划分、音轨信息,BEWO-1M的空间描述特点等是否正确引用。 可能还需要提醒用户注意数据集的许可协议和下载要求,比如是否需要注册或申请权限。 总结步骤: 1. 整理引用中的数据集信息,并正确标注来源。 2. 补充其他常用声源数据集。 3. 提供每个数据集的下载、使用和评测信息。 4. 列出评测指标和方法。 5. 生成相关问题。</think>### 声源数据集资源与使用指南 以下整理了涵盖声源定位、语音分离、音乐分析等场景的常用数据集(含用户引用内容补充),并附下载方式、使用场景及评测指标: --- #### 一、**多场景声源数据集** | 数据集名称 | 特点与用途 | 下载与使用 | 评测指标 | |------------------|---------------------------------------------------------------------------------------------|--------------------------------------------------------------------------|------------------------------------------------------------------------| | **SELD2022** | 真实空间声场数据,支持声源定位与检测任务,包含多麦克风阵列数据[^1] | 通过DCASE官网申请下载:https://dcase.community/challenge2022/task-sound-event-localization-and-detection | - 定位误差(DOA误差)<br>- 检测F1分数 | | **DSD100** | 音乐分离基准数据集,含鼓、贝斯、人声等4音轨立体声数据,适用于音源分离算法研究[^2] | 官方下载:https://sigsep.github.io/datasets/dsd100.html | - 信号失真比(SDR)<br>- 分离谱相似度(SI-SDR) | | **BEWO-1M** | 超大规模双通道音频数据集,含动态声源、多声源空间描述(如"汽车从右前方驶向左前方"),适用于空间音频生成[^4] | 需通过论文作者或合作机构申请访问权限 | - 空间方位重建精度<br>- 语音可懂度(STOI) | | **GTZAN** | 音乐节拍检测数据集,含1000首30秒音乐片段,标注了beat/downbeat时间点[^3] | 官网下载:http://marsyas.info/downloads/datasets.html | - 节拍检测准确率(F-measure)<br>- 强拍对齐误差(Downbeat Alignment Error) | | **UrbanSound8K** | 环境声分类数据集,包含10类城市声音(如狗吠、钻孔声),适用于声源识别与分类 | 下载地址:https://urbansounddataset.weebly.com | - 分类准确率(Accuracy)<br>- 混淆矩阵分析 | --- #### 二、**其他常用声源数据集** 1. **LibriSpeech** - 用途:语音识别训练与测试 - 内容:1000小时英文朗读音频+文本 - 下载:http://www.openslr.org/12 - 评测:词错误率(WER)[^5] 2. **TUT Sound Events** - 用途:声音事件检测(如玻璃破碎、警报声) - 内容:多场景音频标注事件起止时间 - 下载:https://zenodo.org/record/45739 3. **MUSDB18** - 用途:音乐源分离(人声、鼓、贝斯等) - 内容:150首全曲目(含STEM分轨) - 下载:https://sigsep.github.io/datasets/musdb.html --- #### 三、**数据集使用与评测方法** 1. **下载注意事项** - 检查数据许可协议(如CC-BY、非商业用途限制) - 部分数据集需注册学术邮箱申请(如BEWO-1M[^4]) 2. **典型评测指标** - **语音分离/增强**:SDR(信号失真比)、SI-SDR、PESQ(语音质量感知评估) - **声源定位**:DOA误差(方位角偏差)、距离误差 - **事件检测**:F1分数、精确率-召回率曲线 3. **工具推荐** - 评测库:`mir_eval`(音乐分析)、`sed_eval`(声音事件检测) - 处理框架:Librosa(音频特征提取)、PyTorch Audio(数据加载) --- ### 相关问题 1. 如何选择适合声源定位任务的数据集? 2. 音乐分离任务中DSD100和MUSDB18数据集有何区别? 3. 评测声源定位算法需要哪些工具和指标? 4. 如何处理带有空间信息的音频数据集(如BEWO-1M)?
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值