42、音频数据集管理与SOFA文件处理

音频数据集管理与SOFA文件处理

1. 使用数据存储管理音频数据集

深度学习和机器学习模型在处理各种音频信号任务中非常流行。训练这些模型需要处理包含音频数据和标签信息的大型数据集。数据存储对于处理大型数据集很有用, audioDatastore 对象可用于管理音频文件集合。下面将展示如何使用数据存储管理三种不同的音频数据集。

1.1 文件夹名称作为标签的数据

以Google语音命令数据集为例,该数据集中包含语音命令单词的文件存储在文件夹中,文件夹的名称即为单词标签。操作步骤如下:
1. 下载并解压数据集

downloadFolder = matlab.internal.examples.downloadSupportFile("audio","google_speech.zip");
dataFolder = tempdir;
unzip(downloadFolder,dataFolder)
dataset = fullfile(dataFolder,"google_speech");
  1. 创建指向训练数据的音频数据存储
ads = audioDatastore(fullfile(dataset,"train"),IncludeSubfolders=true);
    评论
    成就一亿技术人!
    拼手气红包6.0元
    还能输入1000个字符  | 博主筛选后可见
     
    红包 添加红包
    表情包 插入表情
     条评论被折叠 查看
    添加红包

    请填写红包祝福语或标题

    红包个数最小为10个

    红包金额最低5元

    当前余额3.43前往充值 >
    需支付:10.00
    成就一亿技术人!
    领取后你会自动成为博主和红包主的粉丝 规则
    hope_wisdom
    发出的红包
    实付
    使用余额支付
    点击重新获取
    扫码支付
    钱包余额 0

    抵扣说明:

    1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
    2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

    余额充值