音频数据集管理与SOFA文件处理
1. 使用数据存储管理音频数据集
深度学习和机器学习模型在处理各种音频信号任务中非常流行。训练这些模型需要处理包含音频数据和标签信息的大型数据集。数据存储对于处理大型数据集很有用, audioDatastore 对象可用于管理音频文件集合。下面将展示如何使用数据存储管理三种不同的音频数据集。
1.1 文件夹名称作为标签的数据
以Google语音命令数据集为例,该数据集中包含语音命令单词的文件存储在文件夹中,文件夹的名称即为单词标签。操作步骤如下:
1. 下载并解压数据集
downloadFolder = matlab.internal.examples.downloadSupportFile("audio","google_speech.zip");
dataFolder = tempdir;
unzip(downloadFolder,dataFolder)
dataset = fullfile(dataFolder,"google_speech");
- 创建指向训练数据的音频数据存储
ads = audioDatastore(fullfile(dataset,"train"),IncludeSubfolders=true);
超级会员免费看
订阅专栏 解锁全文
15

被折叠的 条评论
为什么被折叠?



