自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(17)
  • 收藏
  • 关注

原创 (十三)kaldi thchs30 DAE与TDNN(line 109-115)

本部分是对Kaldi thchs30 中run.sh的代码的line 109-115 行研究和知识总结,主要内容为带噪声的神经网络模型以及TDNN的训练。

2023-01-05 00:04:26 351

原创 (十一)kaldi thchs30 说话人自适应训练(SAT)、FMLLR以及quick训练(line 87-104)

七行代码。第一行是对特征进行FMLLR,而后训练GMM模型。第二行是对自适应模型的解码及测试。第三行是根据FMLLR模型对数据进行对齐可以看出核心任务是对特征码本做FMLLR以达到说话人自适应的目的。第四行进行quick训练。第五行对quick训练得到的模型进行解码测试。第六行采用quick训练得到的模型对数据进行对齐。第七行是对开发数据集进行对齐。以下对说话人自适应训练和FMLLR以及quick训练做详细介绍。

2023-01-05 00:03:35 350

原创 (十二)kaldi thchs30 DNN-HMM模型的训练

本部分是对Kaldi thchs30 中run.sh的代码的line 106-107 行研究和知识总结,主要内容为Kaldi中nnet1的DNN-HMM模型训练。

2023-01-05 00:03:13 843

原创 (十)kaldi thchs30 LDA与MLLT(line 78-85)

上面依旧是三行代码,其中第一行为本讲的主要内容,用来做特征调整并训练新模型。第二行是解码测试,这个和之前的一样。第三行是训练好模型后根据模型对数据进行对齐。从本讲开始的三讲都是对三音素模型的调整。本讲包含第一行代码中的Splice,LDA,MLLT。以下对这些处理进行分别讲解。

2023-01-04 18:59:55 672

原创 (九)kaldi thchs30 三音子模型(line 71-76)

其中第一行steps/train_deltas.sh就是三音子模型的训练部分,三音子的训练和单音素模型的主要区别是状态绑定部分,也是本讲的主要内容。第二行是解码测试部分,可以看到该代码和单音素的解码测试是一样的,只是少了–mono选项,因此这里将略过它。第三行是利用第一行训练得到的三因子模型来做强制对齐。代码也是和单音素时是一样的,只是输入模型的变化,因此也不再赘述。

2023-01-04 18:59:21 269

原创 (八)kaldi thchs30 单音素模型训练(line 62-68)

可以看到代码只有三行,其中:第一行steps/train_mono.sh 用来训练单音素模型,主要输出为final.mdl和tree。训练的核心流程就是迭代对齐-统计算GMM与HMM信息-更新参数。第二行local/thchs-30_decode.sh是解码和测试部分,它采用刚刚训练得到的模型来对测试数据集进行解码并计算准确率等信息。第三行steps/align_si.sh 使用src-dir中的模型对data-dir中的数据进行对齐,将结果放在align-dir中。

2023-01-04 18:58:24 327

原创 (七)kaldi thchs30 word-phone-graph(line 38-60)

(七)kaldi thchs30 word-phone-graph(line 38-60)

2023-01-04 18:57:43 140

原创 (六)kaldi thchs30 特征提取(line 0-33)

其中H是当前目录名,thchs指的是语音语料库位置。该程序的执行流程是读取语料库中的{train, dev, test}文件夹下的.wav文件和.trn文件。利用wav文件的名字和所在路径生成wav.scp文件,利用wav.trn文件中的第1行和第3行生成word.txt和phone.txt。这里的word和phone都是直接从文件中读取的。同时由于此处没有说话人识别,因此对于utt2spk(语段到说话人)和spk2utt(说话人到语段)里的内容都是两列相同的wav文件名。

2023-01-04 18:56:52 306

原创 (五)kaldi thchs30训练

cmd.sh:运行配置目录,并行执行命令,通常分 run.pl, queue.pl 两种path.sh:环境变量相关脚本(kaldi公用的全局PATH变量的设置)run.sh :整体流程控制脚本,主入口脚本执行run.sh的时候,要先执行cmd.sh和path.shcmd.sh如果是在集群上训练的话,就用queue.pl,因为当前我们在一台服务器上训练,就把queue.pl全部改为run.pl,单机运行然后就可以直接./run.sh。

2023-01-04 18:56:14 510 3

原创 (四)kaldi thchs30数据准备

在/usr/local/kaldi/egs/thchs30/s5下创建一个文件夹thchs30-openslr。用一切可能的方式上传数据到远程服务器,比如Xtfp,或者sftp,这里使用sftp。删除远程服务器上的文件abc.txt。浏览您的本地目录,即打开本地目录。在远程服务器上创建一个目录abc。将文件从服务器下载到本地计算机。将文件从本地计算机上载到服务器。移动或重命名远程服务器上的文件。移动或重命名远程服务器上的文件。删除远程服务器上的目录abc。更改和/或打印本地工作目录。

2023-01-04 18:55:26 591

原创 (三)kaldi安装

kaldi编译之前切记已经安装Cuda和Cudnn,否则make之后无法用GPU跑DNN。

2023-01-04 18:54:30 1009

原创 (二)Cuda10.2与Cudnn7.6.5安装

(二)Cuda10.2与Cudnn7.6.5安装

2023-01-04 18:53:55 954 1

原创 (一)华为弹性云服务器购买与使用

返回云服务器列表后即可看到购买的云服务器。点击远程登录,输入root密码。即可进入shell界面。

2023-01-04 18:52:07 264

原创 第三章——进程之间的并发控制和死锁

第三章——进程之间的并发控制和死锁

2022-11-15 11:31:39 677

原创 第二章——进程管理

第二章——进程管理

2022-11-15 11:28:20 506

原创 计算机系统导论——第四章测验

计算机系统导论——第四章测验

2022-11-11 18:49:51 280

原创 第一章——操作系统概论

第一章——操作系统概论

2022-11-03 22:08:15 786 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除