TIMIT数据集转换成wav格式,可直接播放-python实现

这篇博客介绍如何利用Python将TIMIT数据集中不能直接打开的sphere格式音频文件转换为可播放的WAV格式。通过`sphfile`模块读取sphere文件,并使用`write_wav`方法将其转换。转换后的音频可以直接播放。
部署运行你感兴趣的模型镜像

下载得到的TIMIT数据集为虽然后缀为WAV,但是其实际是sphere格式,不能直接打开使用

在这里使用python实现转换,得到的音频可直接打开。

from sphfile import SPHFile
import glob
import os
#  将TIMIT语料库转换为wav格式
#  下载好的TIMIT语料库,不能直接读取和打开因为它是sphere格式
#  要转换成wav格式才能读取和打开,下面就是转化的代码

if __name__ == "__main__":
    #  TIMIT文件的路径 注意 r
    path = r'D:\111AA\SX194.WAV'
    # 多条语音转换
    # path = r'D:\1AADNN\DNN - IRM\TIMIT\TEST\*\*\*.WAV'
    sph_files = glob.glob(path)
    print(sph_files)
    print(len(sph_files), "个语音")
    for i in sph_files:
        sph = SPHFile(i)
        sph.write_wav(filename=i.replace(".WAV", "a.wav"))
        #  改名字,直接适用WAV到wav,不改名字,不成功
        #os.remove(i)  # 转换后,删除原始的语音文件
        print("处理完成!")

参考大哥的博客:

Timit 数据集中音频无法播放,使用python进行格式转换[附Timit 百度网盘下载地址]_ASR_THU的博客-优快云博客

您可能感兴趣的与本文相关的镜像

Python3.10

Python3.10

Conda
Python

Python 是一种高级、解释型、通用的编程语言,以其简洁易读的语法而闻名,适用于广泛的应用,包括Web开发、数据分析、人工智能和自动化脚本

评论 2
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值