语音相关论文总结

原创于 2021-07-08 11:28:00 发布 · 231 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY 版权协议，转载请附上原文出处链接和本声明。

TTS 专栏收录该内容

4 篇文章

订阅专栏

在这里插入图片描述

文章目录

1. 声码器
2. 音素对齐
3. TTS

1. 声码器

20201023 HiFi-GAN: Generative Adversarial Networks for Efficient and High Fidelity Speech Synthesis https://arxiv.org/abs/2010.05646
20200512 FeatherWave: An efficient high-fidelity neural vocoder with multi-band linear prediction
BLSTM
Transformer-TTS
CNN blocks

2. 音素对齐

20170820 Montreal Forced Aligner: trainable text-speech alignment using Kaldi https://www.isca-speech.org/archive/Interspeech_2017/pdfs/1386.PDF

3. TTS

20180216 Tacotron2：NATURAL TTS SYNTHESIS BY CONDITIONING WAVENET ON MEL SPECTROGRAM
PREDICTIONS https://arxiv.org/pdf/1712.05884.pdf
20180222 Deep Voice 3: Scaling Text-to-Speech with Convolutional Sequence Learning https://arxiv.org/pdf/1710.07654.pdf
20180919 Transformer-TTS: Neural Speech Synthesis with Transformer Network https://arxiv.org/abs/1809.08895v1
20190512 Waveglow: A Flow-based Generative Network for Speech Synthesis https://ieeexplore.ieee.org/document/8683143/
20201023 Glow-TTS：A Generative Flow for Text-to-Speech via Monotonic Alignment Search https://arxiv.org/abs/2005.11129
20210304 FastSpeech 2: Fast and High-Quality End-to-End Text to Speech https://arxiv.org/abs/2006.04558
202103 BVAE-TTS：BIDIRECTIONAL VARIATIONAL INFERENCE FOR
NON-AUTOREGRESSIVE TEXT-TO-SPEECH https://openreview.net/pdf?id=o3iritJHLfO

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。