sph2pipe用法

  • example
import subprocess
import os

def nist2wav(src_dir):
    count = 0
    for subdir, dirs, files in os.walk(src_dir):
        for f in files:
            fullFilename = os.path.join(subdir, f)
            if f.endswith('.wv1') or f.endswith('.wv2') or f.endswith('.WAV'):
                count += 1
                os.rename(fullFilename,fullFilename+".WAV")
                os.system("./sph2pipe "+fullFilename+".WAV"+" -f rif " +fullFilename)
                os.remove(fullFilename+".WAV")
                print(fullFilename)

if __name__ == '__main__':
    nist2wav('/storage/workspace/zhujieenv/Automatic_Speech_Recognition/speechvalley/data/data/lisa/data/timit/raw/TIMIT')

说明:

  1. /storage/workspace/zhujieenv/Automatic_Speech_Recognition/speechvalley/data/data/lisa/data/timit/raw/TIMIT为包含sph文件的目录,某个子目录包含的文件为SA1.PHN、SA1.TXT、SA1.WRD、SA1.WAV
  2. SA1.PHN:
0 9640 h#
9640 11240 sh
11240 12783 iy
12783 14078 hv
14078 16157 ae
16157 16880 dcl
16880 17103 d
17103 17587 y
17587 18760 er
18760 19720 dcl
19720 19962 d
19962 21514 aa
21514 22680 r
22680 23800 kcl
23800 24104 k
24104 26280 s
26280 28591 uw
28591 29179 dx
29179 30337 ih
30337 31880 ng
31880 32500 gcl
32500 33170 g
33170 33829 r
33829 35150 iy
35150 37370 s
37370 38568 iy
38568 40546 w
40546 42357 aa
42357 45119 sh
45119 45624 epi
45624 46855 w
46855 48680 aa
48680 49240 dx
49240 51033 er
51033 52378 q
52378 54500 ao
54500 55461 l
55461 57395 y
57395 59179 iy
59179 60600 axr
60600 63440 h#
  1. SA1.TXT:
0 63488 She had your dark suit in greasy wash water all year.
  1. SA1.WRD:
9640 12783 she
12783 17103 had
17103 18760 your
18760 24104 dark
24104 29179 suit
29179 31880 in
31880 38568 greasy
38568 45119 wash
45624 51033 water
52378 55461 all
55461 60600 year
Sph2pipe是一个用于将Sphinx speech recognition toolkit的HUB5样本文本转成WAV音频文件的小工具。以下是下载并安装sph2pipe的具体步骤: 1. **访问Sphinx官网**: 首先,你需要访问Sphinx ASR项目的官方网站:https://cmusphinx.github.io/ 在该网站上找到适合你操作系统的版本。通常,最新版本适用于大多数Linux系统。 2. **下载sph2pipe**: 在项目页面找到对应平台的sphinxbase包,它包含了sph2pipe工具。例如,如果你使用的是Ubuntu,可能会下载`libsox-fmt-all-dev`,而Windows用户则需要`sphinxbase.dll`。 3. **解压文件**: 将下载的压缩包解压到一个方便的地方,比如`~/Downloads`或`/usr/local/src`。 4. **配置环境变量**: 对于Unix-like系统(如Linux、macOS),如果sph2pipe不在系统路径中,你需要将其添加到PATH环境变量中。例如,可以创建软链接到bin目录下: ``` ln -s /path/to/sphinxbase/bin/sph2pipe /usr/local/bin/ ``` 5. **检查安装**: 打开终端,输入`sph2pipe`命令确认是否能正常运行。如果可以顺利执行,说明安装成功。 6. **使用sph2pipe**: 现在你可以通过sph2pipe命令行工具处理Sphinx相关的音频转换任务了。例如,将文本转为wav文件: ``` sph2pipe -f wav -p your_password your_input_file.txt your_output.wav ``` 这里`your_password`是你之前训练模型时使用的加密密码,`your_input_file.txt`是包含语音识别输入的文本文件,`your_output.wav`是生成的输出音频文件。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值