
python
文章平均质量分 59
贾大帅
这个作者很懒,什么都没留下…
展开
-
windows下运行SyntaSpeech
SyntaSpeech 在windows运行的6点问题及解决方案原创 2022-06-08 16:21:07 · 389 阅读 · 4 评论 -
完全端到端语音合成JETS: Jointly Training FastSpeech2 and HiFi-GAN for End to End Text toSpeech 简单解读
abstract部分简单说了一下,一般的TTS系统都有声学部分和vocoder,通过中间特征mel谱连接,这个模型是e2e的,所以中间的声学特征不会mismatch,也不用finetune。而且移除了额外的alignment tool,实现在了espnet2上流程图如上,和fs2+hifigan没有什么区别不过在variance adaptor中,写的结构和开源的代码是一致的,也就是pitch和energy是音素级的,在fastspeech原始论文中是帧级的下面简介了一下fastspeech原创 2022-05-17 16:13:34 · 1623 阅读 · 2 评论 -
tensorflow的resize_images和pytorch的interpolate
最近在tensorflow v1和pytorch都有写。里面有写函数具有相同功能。现在的主要需求是把语音的mel谱tile hopsize倍,但是希望能平滑一些。推荐2个函数,一个是tensorflow的tf.image.resize_images一个是pytorch的torch.nn.functional.interpolate输入都是4维的数据,所以在送进去之前我都进行过e...原创 2020-03-19 02:44:04 · 2899 阅读 · 0 评论 -
pytorch的nn.ReflectionPad1d
最近在看一个torch的项目,用到了nn.ReflectionPad1d这个函数,随便一搜都是ReflectionPad2d的。于是喵了一眼官网,写的是真的清楚哇。比较懒,直接截个图,简单说一下。所谓Reflection就像照镜子一样。我再用【9,8,7,6】再来说说。这个函数里面的值可以是一个int,也可以是(int,int)这样的list或tuple。如果是一个int就左右pa...原创 2020-03-18 21:13:25 · 3662 阅读 · 0 评论 -
关于wav文件读取的一个小问题(librosa和soundfile)
今天在跑melgan时候,发现GPU使用率低的感人。。原本以为是pytorch的dataloader的问题之后把num_worker改为0,用主进程进行读取数据。发现主要卡在了librosa的load上from librosa.core import loaddata, sr =load('test.wav', sr=16000)做了个小测试如下:原来在libros...原创 2020-03-17 18:34:38 · 6192 阅读 · 4 评论 -
tensorflow限制使用某块显卡
在服务器上运行tensorflow的时候,我们有的程序可能只会使用到一块显卡,但是服务器上有很多显卡,如果一起用主要2个问题。1.显存可能会都被占满2.不指定的话总会默认使用第一个。虽然在程序里面也可以指定使用哪块显卡,但是我觉得不如在命令上加个参数实用。CUDA_VISIBLE_DEVICES=3,4 python demo.py上面这个命令就是只给demo.py使用3和4两原创 2018-01-31 17:10:54 · 1501 阅读 · 0 评论 -
通过wav文件和text文件训练出phoneme文件的过程
环境:python2.7和python3.6最近训练的一个神经网络需要wav文件和phn文件作为自己输入。所有的数据库中都有wav文件,但是phoneme文件却不是每个数据库都有。TIMIT数据库中就PHN文件。先贴个PHN文件的图。SX127.PHN再看一下这句话的文本。后面就是这句话没问题,0-24679肯定就是时间了。我们看到时间是原创 2020-03-17 18:40:59 · 906 阅读 · 2 评论 -
librosa的安装
在很多设计到语音识别合成等方面的项目里经常用到python的一个包librosa但是这个包直接用pip安装容易出现GCC的CXXABI一些各种各样的问题推荐使用conda安装但是conda的源在国外下面这个是conda换源的命令其中 https://example.com 可以随意更换底部的源conda config --add channels https://e原创 2018-01-29 13:21:42 · 5005 阅读 · 6 评论