
语音识别
文章平均质量分 65
人工智能商机
人工智能新闻,语音图像处理,AI芯片,商业分析。
展开
-
理解人工智能算法,初中数学知识就够了
目录小学三年级我们就开始学习人工智能了初中二年级的知识解释机器学习求解思路初中三年级的知识解释梯度下降法我们需要更复杂的模型结构深度学习的数学建模思路深度学习到底有多牛逼?对于没有在学校里学习过机器学习和深度学习的同学,在谈论人工智能时,常常会听到一些专有名词,比如机器学习,深度学习、深度神经网络、梯度下降法、BP算法、损失函数、欠拟合、过拟合、训练集、验证集和测试集,经常会被整懵了,别人聊的时候只能在旁边呵呵。想去学习,发现网上书上的介绍全是公式。怎么办?本文用初...原创 2021-03-27 17:04:14 · 1123 阅读 · 1 评论 -
人工智能的新业务(以及与传统软件的区别)
马丁·卡萨多(Martin Casado)和马特·伯恩斯坦(Matt Bornstein)原文链接:https://a16z.com/2020/02/16/the-new-business-of-ai-and-how-its-different-from-traditional-software/?from=groupmessage&isappinstalled=0从技术...翻译 2020-03-01 18:16:14 · 2434 阅读 · 0 评论 -
有趣的开源软件:语音识别工具Kaldi (二)
在上一篇blog中简单的介绍了Kaldi的安装方法 有趣的开源软件:语音识别工具Kaldi (一) 在这篇blog中继续Kaldi模型训练的步骤,介绍一下在模型训练之前的一些数据准备的工作。因为我也是正在学习语音识别和Kaldi,有些地方不一定说的很正确,如果发现错误,还请指正。在Kaldi源代码树中,有一个叫做egs的文件夹,在这个文件夹中保存着一些Kaldi在公共数据集上的训练步骤(s转载 2017-12-15 22:41:34 · 1637 阅读 · 3 评论 -
Kaldi HCLG 深入理解
1. 相关部分包含的主要任务1.1 WFST Key Conceptsdeterminizationminimizationcompositionequivalentepsilon-freefunctionalon-demand algorithmweight-pushingepsilon removal1.2 HMM Key ConceptsMarko转载 2017-12-15 22:37:09 · 2014 阅读 · 0 评论 -
Kaldi决策树状态绑定学习笔记
原理学习资料: 1. SLP Ch10.3 2. Daney Povey Kaldi Lecture3 3. 官方决策树三个文档、HMM文档 4. 爱丁堡大学CDHMM-PPT 5. 论文《Tree-Based State Tying For High Accuracy Acoustic Modelling》S.J.Young 6. 论文《Decision Tr转载 2017-12-15 21:39:05 · 1005 阅读 · 0 评论 -
HTK语音识别中的决策树
1.为什么需要决策树我们在使用HTK进行语音识别模型训练的过程中,首先进行的是单音素、单个高斯的模型训练。抛开单个高斯不说,单音素模型本身有很大缺点:没有考虑到本音素前后音素的发音对本音素的影响。比如,同样是一个音素iy,如果它前面的音素分别是h和p,那么iy这个音素在这两种情况下的发音会有所不同,那么模型参数也就会受到其影响,此时,如果用同一个模型来描述音素iy,那么就会不合理。转载 2017-12-15 21:17:51 · 877 阅读 · 0 评论 -
混合高斯模型算法
下面介绍一下几种典型的机器算法首先第一种是高斯混合模型算法:高斯模型有单高斯模型(SGM)和混合高斯模型(GMM)两种。(1)单高斯模型:为简单起见,阈值t的选取一般靠经验值来设定。通常意义下,我们一般取t=0.7-0.75之间。二维情况如下所示:(2)混合高斯模型: 对于(b)图所示的情况转载 2016-06-16 20:46:05 · 2209 阅读 · 0 评论 -
Speech recognition with Kaldi lectures
Speech recognition with Kaldi lecturesThis is a weekly lecture series on the Kaldi toolkit, currently being created. This will eventually have video. Lecture 1 (Overview of the course; gettin转载 2016-01-02 12:33:55 · 617 阅读 · 0 评论 -
GMM-HMM语音识别模型 原理篇
本文简明讲述GMM-HMM在语音识别上的原理,建模和测试过程。这篇blog只回答三个问题:1. 什么是Hidden Markov Model?HMM要解决的三个问题:1) Likelihood2) Decoding3) Training2. GMM是神马?怎样用GMM求某一音素(phoneme)的概率?3. GMM+HMM大法解决语音转载 2015-12-13 01:51:52 · 1618 阅读 · 0 评论 -
音素、音节
音素组成音节、由音节组成词、由词组成句子。规则合成方法多以音节、半音节或音素为合成单元。音节是语音中最自然的结构单位。在汉语中,一个音节就是汉语中一个字的音,由音节构成词,最后由词构成句子。所以由音节作为基元构成的语句也是无限多的。按由小到大的顺序排列,语音学中的音素、双音素、半音节、音节、词、短语和句子都可以用作合成单元,合成单元越大,合成语音音质越好,但合成语音的数量及其数码率也越原创 2016-01-16 00:29:09 · 1758 阅读 · 0 评论 -
什么是韵律词、韵律短语、语调短语?
韵律词 的概念与分词类似。韵律短语 包含韵律词,一般由韵律词和语气词组成。语调短语 包含韵律短语,一般指一个大停顿。摘要 语句和篇章的韵律结构和信息结构的分析以及其模型化, 是提高 语音合成自然度的关键 我们认为汉语普通话的韵律结构是分层次的, 由音步韵律词,韵律短语和语调短语组成 韵律短语可以按照感知分为两 类: minor phrase (通原创 2015-12-08 14:52:53 · 11434 阅读 · 0 评论