语音识别
cug_coffee
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
高斯混合模型
高斯混合模型,首先说的那就是高斯分布,f(x)=12πσexp(−(x−μ)22σ2)=N(x,σ,μ2)f(x)=\frac{1}{\sqrt{{2\pi}}\sigma}\exp(-\frac{(x-\mu)^2}{2\sigma^2})=N(x,\sigma,\mu^2)f(x)=2πσ1exp(−2σ2(x−μ)2)=N(x,σ,μ2)对应的均值方差是μ\muμ,σ2\si...原创 2020-03-16 10:26:01 · 414 阅读 · 0 评论 -
最大似然估计
现在简单写写最大似然估计。最大似然估计是一个概率估计问题,譬如已知一个数据空间XXX,数据XXX中的每一个样本都有n为特征。有样本整体x=[x1,x2,x3,x4,.....,xn]x=[x_1,x_2,x_3,x_4,.....,x_n]x=[x1,x2,x3,x4,.....,xn]。同时了有这样的先验知识,知道数据空间XXX里面所有的样本,都符合一个的概率密度函数(prob de...原创 2020-03-16 08:35:00 · 427 阅读 · 0 评论 -
fst-graph
这里就直接贴上代码了。digraph G { node [shape = circle] 0 -> 1 [ label = sil ] 0 -> 2 [ label = w ] 1 -> 1 [ label = sil ] 1 -> 2 [ label = w ] 2 -> 2 [ label = w ] 2 -> 3 [ labe...原创 2020-03-05 13:34:03 · 508 阅读 · 0 评论 -
构图逻辑
现在写写一般的构图逻辑,这里会介绍ci-phone的,同时也会介绍cd-phone的构图逻辑。一般介绍ci-phone构图cd-phone构图下面先介绍下技术背景,主要应用在解码过程中,也就是语音识别;譬如唤醒、命令词都可以应用。对于一个词的发音序列word : phn1 phn2 phn3word: A B C D E ... Z其中A就是词头,Z就是词尾。先介绍ci-p...原创 2020-03-05 13:18:47 · 536 阅读 · 0 评论 -
语音识别--gmm-hmm思考
简单回顾一下今天所看的内容:gmm-hmmpdf: 概率密度函数,在这里可以由gmm来估计,同样也可以用dnn来估计。gmm:高斯混合模型,单高斯函数,多高斯函数。能拟合任何函数,这里会涉及到均值方差等变量语音有短时平稳的特性,可以用高斯混合模型来估计;从而就会有概率密度函数。hmm:隐马尔科夫模型,双马尔科夫链的过程。关键在于理解状态。首先需要的说的马尔科夫链。当与时间无关时,...原创 2020-03-01 01:29:51 · 506 阅读 · 0 评论 -
语音识别-先验概率后验概率似然函数
这里贴一个网页:https://www.cnblogs.com/wjgaas/p/4523779.html简单的说:Posterior probability ∝ Likelihood × Prior probability从语音识别的角度来看这个问题,那么就是,解码的过程就是求取后验概率的过程。ref_W = argmax_w(p(O|W) * P(W)/P(O))已知观察...原创 2020-03-01 01:24:06 · 1346 阅读 · 0 评论 -
语音识别Topo笔记
这里记录一下语音识别中的拓扑的问题。三因子状态的topoChain-model的topoCtc的topo三因子状态的topo<Topology><TopologyEntry><ForPhones> 1 2 3 4 5 6 7 8 </ForPhones><State> 0 <PdfClass> 0<...原创 2020-03-01 01:18:06 · 269 阅读 · 0 评论
分享