1.首先安装HTK-3.4.1和HDecode-3.4.1,HTS-2.3_for_HTK-3.4.1
所有的东西都在这个网站的下面::http://hts.sp.nitech.ac.jp/
a.下载的版本分别是:
HTK-3.4.1: http://htk.eng.cam.ac.uk/download.shtml
HDecode-3.4.1: http://htk.eng.cam.ac.uk/extensions/index.shtml
b.解压下
$ tar -zxvf HTK-3.4.1.tar.gz
$ tar -zxvf HDecode-3.4.1.tar.gz
c.然后应用下载的补丁HTS-2.3_for_HTK-3.4.1.patch
$ cd htk
$ patch -p1 -d . path/ HTS-2.3_for_HTK-3.4.1.patch
d.运行配置脚本
$ ./configure
如果想看些细节的内容,使用./configure --help
e.编译安装
$ make
$ make install(可以在前面加个sudo)
好像某个部分会报错,报错的是HTK里面关于ARCH的错误,通过在文件esignal.c里面添加
#define ARCH "darwin"可以解决这个错误.
2.安装SPTK
SPTK-3.10:http://sp-tk.sourceforge.net/
安装步骤都是:
a. 解压相应的文件夹
b. cd 相应文件夹
c. ./configure
d. make
e. make install
3.sudo apt-get install tcl tk libsnack2
4.hts_engine API
hts_engine_API-1.10:http://hts-engine.sourceforge.net/
安装步骤同安装sptk
5.安装speech_tools下载地址:http://www.cstr.ed.ac.uk/downloads/festival/2.4/
下载地址:speech_tools和festival是放在一起的,要求speech_tool先编译.
$ sudo apt-get install g++ (因为要用到g++的库,所以要更新确定已安装)不一定需要
$ sudo apt-get install libncurses5-dev(可能直接安装装不上,可以使用aptitude命令安装相关的以来之后在安装包)
$ ./configure
$ make
$ make test 显示安装成功
6.安装festival
$ ./configure
$ make
$ make install(忘了是否有这一步,可以试试)
$ make test(会报错需要下载相关的文件festvox_don,festlex_POSLEX,festlex_OALD,festlex_CMU,fes

本文档详细介绍了如何安装和配置HTK、HDecode、SPTK、speech_tools、festival、festvox等工具,以及如何将.wav音频转换为16k .wav格式,为HTS语音合成系统训练数据做准备。通过HTS_engine_API生成不同的语音合成方法,如1mix、2mix、stc和hts_engine。整个过程包括环境配置、数据预处理、模型训练和合成语音测试。
最低0.47元/天 解锁文章
2156





