
语音
Rookie羊
这个作者很懒,什么都没留下…
展开
-
tacotron2等端到端语音合成的github汇总
1 Tacotron-2https://github.com/Rayhane-mamah/Tacotron-2https://github.com/NVIDIA/tacotron22 韵律预测https://github.com/BoragoCode/AttentionBasedProsodyPrediction3 tacotron1, tacotron2, wavenet和char2...原创 2019-05-22 19:41:49 · 2787 阅读 · 1 评论 -
tacotron2运行笔记
Tacotron-2:DeepMind的Tacotron-2的Tensorflow实现。 本文描述的深度神经网络结构:: Natural TTS synthesis by conditioning Wavenet on MEL spectogram predictionsgithub地址:https://github.com/Rookie-Chenfy/Tacotron-2这个 github...原创 2019-05-14 15:42:42 · 6466 阅读 · 22 评论 -
梅尔频率倒谱系数(MFCC)理论整理
主要图形:时域图、频谱图、语谱图https://blog.youkuaiyun.com/yongchunaq/article/details/36227961基础参考博客:https://blog.youkuaiyun.com/zouxy09/article/details/9156785https://blog.youkuaiyun.com/qq_28006327/article/details/59129110主要知识要...原创 2019-05-13 16:28:49 · 720 阅读 · 0 评论 -
merlin里的speaker_adaptation模型训练
说明speaker_adaptation模型是在merlin的egs下自带的多个说话人自适应的tts模型直接运行会出现一些错误,主要是01_set_up.sh 需要修改的地方,一些调用的工具包需要自己去merlin/tools下,运行compile_other_speech_tools.sh脚本和compile_htk.sh下载。#------------》引用的工具包地址《《-------...原创 2019-05-13 17:30:59 · 440 阅读 · 0 评论 -
merlin主要源码解析(一)
run_merlin.py详解run_merlin.py是Merlin框架的核心脚本,配套(.conf)的参数文件使用,其中包括了时延模型训练,声学模型训练和音频文件的生成等众多的功能,其参数文件中的也众多,没有去读相应的源码很难解析其内部的工作原理和训练机制,本博客也算对merlin的代码做一个记录,方便以后查阅。1、先从1220行的'__main__':开始:既然是配套参数文件使用,第一...原创 2019-05-22 19:43:00 · 1952 阅读 · 0 评论