
TTS语音_AI
mishidemudong
菜鸟上路,一颗红心,两手准备。
展开
-
#####好好好好###### 什么是我所说的 Conversational Robot
包括 Dialogue System, QA System, Chatbot 简述。 下面大部分文字是整体的介绍,当然要完全把这三个部分都详细说完,可能就够一本书了,没几百篇论文的阅读出不来。 主要是因为每个系统的每个实现方法经常都是独立的一个领域,而很少有介绍完整成品的东西,也几乎没有完整的书籍。Conversational Robot 的来历主要是为了避免dialogue和chat这两...转载 2018-08-01 16:25:50 · 484 阅读 · 0 评论 -
MFCC(Mel 倒谱系数)
Mel倒谱系数Mel倒谱系数:MFCC Mel频率倒谱系数(Mel Frequency Cepstrum Coefficient)的缩写是MFCC,Mel频率是基于人耳听觉特性提出来的,它与Hz频率成非线性对应关系。Mel频率倒谱系数(MFCC)则是利用它们之间的这种关系,计算得到的Hz频谱特征。 用录音设备录制一段模拟语音信号后,经由自定的取样频率(如8000 Hz、16000 Hz等)采样后转...转载 2018-06-20 11:43:07 · 2580 阅读 · 0 评论 -
端到端的TTS深度学习模型tacotron(中文语音合成)
TACONTRON: A Fully End-to-End Text-To-Speech Synthesis Model通常的TTS模型包含许多模块,例如文本分析, 声学模型, 音频合成等。而构建这些模块需要大量专业相关的知识以及特征工程,这将花费大量的时间和精力,而且各个模块之间组合在一起也会产生很多新的问题。TACOTRON是一个端到端的深度学习TTS模型,它可以说是将这些模块都放在了一个黑箱...转载 2018-06-12 00:37:43 · 8097 阅读 · 2 评论 -
NLP专题论文解读:从Chatbot、NER到QA系统...
一、对话系统论文 | Affective Neural Response Generation链接 | http://www.paperweekly.site/papers/1043作者 | Jeffreygao1. 论文动机 论文来自华为诺亚方舟实验室。都说人工智能要有情感,能体会到人的喜怒哀乐,今天就来介绍一篇带有情绪的 chatbot。在以往的研究中,大部分对话系统都只关注生成对话的语法语义...转载 2018-06-06 17:51:08 · 944 阅读 · 0 评论 -
Residual Learning
本文参考的论文 Deep Residual Learning for Image Recognition Identity Mappings in Deep Residual Networks Inception-v4, Inception-ResNet and the Impact of Residual Connections on Learning Wide Residual Network...转载 2018-06-05 01:04:57 · 4537 阅读 · 0 评论