
语音识别
纸上得来终觉浅~
周围的人都比你厉害,你才会慢慢变强
展开
-
sge集群部署
https://blog.youkuaiyun.com/wuxianfeng1987/article/details/72874905转载 2021-06-15 10:06:34 · 1164 阅读 · 0 评论 -
c++ Jieba分词
https://blog.youkuaiyun.com/xiaolong361/article/details/76640511转载 2021-06-11 10:41:43 · 2158 阅读 · 1 评论 -
kaldi编译报错:找不到库
https://blog.youkuaiyun.com/boshuzhang/article/details/81988264转载 2021-06-02 15:47:50 · 620 阅读 · 0 评论 -
2021-03-18
https://blog.youkuaiyun.com/xuyinxin/article/details/112258833转载 2021-03-18 14:05:52 · 413 阅读 · 0 评论 -
pytorch ctcdecode安装
git clone --recursive https://github.com/parlance/ctcdecode.gitcd ctcdecode && pip install .原创 2020-12-27 11:11:55 · 1172 阅读 · 0 评论 -
torch.nn.CTCLoss
https://zhuanlan.zhihu.com/p/67415439转载 2020-05-20 10:27:24 · 1988 阅读 · 0 评论 -
ubuntu18编译htk
https://www.cnblogs.com/dylancao/p/9988547.html转载 2020-05-11 17:14:09 · 302 阅读 · 0 评论 -
基于RNN的语言模型
https://blog.youkuaiyun.com/qq_33837704/article/details/79513049?utm_medium=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-38&depth_1-utm_source=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-38转载 2020-05-08 22:35:07 · 515 阅读 · 0 评论 -
编辑距离及编辑距离算法
https://www.cnblogs.com/biyeymyhjob/archive/2012/09/28/2707343.html转载 2020-05-07 16:11:45 · 605 阅读 · 1 评论 -
集束搜索beam search和贪心搜索greedy search
https://blog.youkuaiyun.com/qq_16234613/article/details/83012046转载 2020-05-07 16:01:38 · 491 阅读 · 0 评论 -
讲的特别好!!!EM算法与混合高斯模型(Gaussian mixture model, GMM)
https://blog.youkuaiyun.com/lin_limin/article/details/81048411转载 2020-04-28 16:58:27 · 402 阅读 · 0 评论 -
deepspeech v2
https://blog.youkuaiyun.com/qq_27842551/article/details/100054007转载 2020-04-25 11:14:13 · 621 阅读 · 0 评论 -
语音端点检测(Voice Activity Detection,VAD)
1、VAD的总体步骤:https://www.bbsmax.com/A/1O5EOo73z7/2、基于短时能量和过零率的简单实现(实际上精确度高的VAD会提取4种或更多的特征进行判断,这里只介绍两种特征的基本方法):https://blog.youkuaiyun.com/weixin_42788078/article/details/89634363?depth_1-utm_source=distribu...原创 2020-03-09 16:16:36 · 2326 阅读 · 0 评论 -
HCLG.fst
原创 2020-03-06 16:38:19 · 2681 阅读 · 0 评论 -
kaldi报错:ERROR (nnet3-chain-train[5.5.635~1486-0e031]:AddVecVec():cu-vector.cc:572) cudaError_t 98 :
将之前服务器上编译运行的结果直接移植到另一台服务器上,由于cuda版本号不同,在训练第一个迭代的时候报错:ERROR(nnet3-chain-train[5.5.635~1486-0e031]:AddVecVec():cu-vector.cc:572)cudaError_t98:"invaliddevicefunction"returnedfrom'cudaGetLastE...原创 2020-03-02 15:19:51 · 1036 阅读 · 0 评论 -
Python pydub实现语音停顿切分
https://blog.youkuaiyun.com/wangqianqianya/article/details/89605298转载 2020-02-21 11:17:59 · 2644 阅读 · 0 评论 -
基于Kaldi+GStreamer搭建线上的实时语音识别器
一、安装python2.7和Tornado 4,ws4py, YAML,JSON等依赖包1、sudo pip2 install tornado==4.32、sudo pip2 install ws4py==0.3.23、sudo pip2 install pyyaml4、sudo pip2 install https://pypi.python.org/packages/40/a...原创 2020-02-18 10:39:36 · 3668 阅读 · 9 评论 -
HMM三个问题
1、前向算法和后向算法2、维特比算法(解码)3、参数学习问题原创 2020-02-15 20:24:11 · 458 阅读 · 0 评论 -
Em算法通用步骤
直观理解EM算法求似然函数最大值:原创 2020-02-15 17:04:19 · 587 阅读 · 0 评论 -
kaldi训练报错:out of memory
训练时报错:Memory info: free:11684M, used:512M, total:12196M, free/total:0.958019 CUDA error: 'out of memory',按照它的提示:Not in compute-exclusive mode. Suggestion: use 'nvidia-smi -c 3' to set compute exclusi...原创 2020-02-13 19:12:12 · 808 阅读 · 1 评论 -
Kaldi中实现模型的可视化
初学kaldi语音识别,在Linux上查看文件不像Windows那么简单易行。在kaldi的egs文件夹中有许多的示例程序,当你成功跑完之后,在相应的示例程序目录下有exp文件夹,这里面包括示例训练出来的一些模型文件。跑完Thchs30之后,exp目录,在mono目录下有final.mal,想看看这文件中是什么内容,但就是打不开,试了好多查看文件软件,在网上也查阅了很多关于.m...转载 2020-02-12 13:13:00 · 597 阅读 · 1 评论 -
Kaldi 报错:queue.pl: Error submitting jobs to queue
运行run.sh时,提示错误:queue.pl: Error submitting jobs to queue,本地跑demo,将cmd.sh文件中的queue.pl改成run.pl即可。原创 2020-02-12 11:01:02 · 408 阅读 · 0 评论 -
kaldi报错:train_lm.sh is not found. That might mean it's not installed
运行train_lm.sh时,报错:train_lm.sh is not found. That might mean it's not installed。or it is not added to PATH。Use the script tools/extras/install_kaldi_lm.sh to install it。根据提示,去tools/extras目录下,运行install_...原创 2020-02-12 10:52:55 · 816 阅读 · 0 评论 -
kaldi报错:g2p.py is not found. Checkout tools/extras/install_sequitur.sh.
prepare_dict.sh脚本运行时,报错g2p.py is not found. Checkout tools/extras/install_sequitur.sh.。解决方案:回到tools/extras目录下,运行install_sequitur.sh脚本,此时报错:./install_sequitur.sh: Error: I require swig but it's not ins...原创 2020-02-12 10:49:50 · 1258 阅读 · 0 评论 -
kaldi报错:ImportError: No module named mmseg和no module named reload
在运行multi_cn时候,报错:ImportError: No module named mmseg,说明找不到mmseg这个包。进入tools/extras目录中有个install_mmseg脚本,可以下载到mmseg包,然后回到tools目录下,进入tools/mmseg文件夹下,运行python setup.py install安装mmseg包,报错:no module named rel...原创 2020-02-12 10:28:59 · 3727 阅读 · 0 评论 -
语音特征MFCC提取过程详解
https://blog.youkuaiyun.com/class_brick/article/details/82743741转载 2020-01-10 13:03:18 · 880 阅读 · 0 评论 -
Transformer的PyTorch实现
https://blog.youkuaiyun.com/stupid_3/article/details/83184691转载 2020-01-07 15:43:08 · 514 阅读 · 0 评论 -
语音相关比赛
https://blog.youkuaiyun.com/yj13811596648/article/details/103164362转载 2020-01-06 16:21:56 · 414 阅读 · 0 评论 -
bytes-pair-encoding -- 解决未登录词问题
https://blog.youkuaiyun.com/jmh1996/article/details/89286898转载 2019-12-24 18:19:23 · 237 阅读 · 0 评论 -
自然语言处理中的语言模型预训练方法(ELMo、GPT和BERT)
https://www.cnblogs.com/robert-dlut/p/9824346.html转载 2019-12-24 15:57:58 · 379 阅读 · 0 评论 -
DFSMN系列
https://blog.youkuaiyun.com/qq_26778411/article/details/89682447转载 2019-12-24 10:12:08 · 812 阅读 · 0 评论 -
端到端语音识别时代
https://cloud.tencent.com/developer/news/375304转载 2019-12-17 16:21:13 · 321 阅读 · 0 评论 -
Transformer模型及其语音识别应用
https://www.zhihu.com/question/322027027/answer/673423447转载 2019-12-17 16:17:48 · 5127 阅读 · 0 评论 -
Interspeech 2019 | 阿里达摩院语音实验室:联合CTC和Transformer的自动中文纠错模型
http://www.sohu.com/a/340981493_129720转载 2019-12-17 16:10:12 · 686 阅读 · 0 评论 -
LAS模型及相关论文进展
https://blog.youkuaiyun.com/weixin_43612049/article/details/101795842转载 2019-12-17 15:55:16 · 482 阅读 · 0 评论 -
论文解读:对端到端语音识别网络的两种全新探索
云从科技基于端到端的语音识别网络进行了两种方法的探索,一种是基于原有的 CNN-RNN-CTC 网络的改进,一种是基于 CTC loss 与 attention loss 结合机制的网络。下面是对这两种方法的详细解读。1、CASCADED CNN-RESBILSTM-CTC: AN END-TO-END ACOUSTIC MODEL FOR SPEECH RECOGNITION地址:htt...转载 2019-12-17 15:48:53 · 1488 阅读 · 0 评论 -
语音识别 WaveNet
https://www.jianshu.com/p/bb13ae73e427转载 2019-12-17 14:59:20 · 476 阅读 · 0 评论 -
token passing model
算法过程大致如下:初始化(t=0): 初始state(入口处)的Token的s=0 其他state的Token的s=-inf执行过程(t>0): 复制若干数目Token,并将其传递至所有与该state连接的其他state中,并且对其值做如下操作: 在每个state中,比较所有token,留下分值最高的token,抛弃其他所有token(Viterbi...转载 2019-11-26 10:00:19 · 735 阅读 · 0 评论 -
viterbi算法
已知hmm参数,观察序列,求最可能的状态序列,可用维特比算法。viterbi算法其实就是多步骤每步多选择模型的最优选择问题,其在每一步的所有选择都保存了前续所有步骤到当前步骤当前选择的最小总代价(或者最大价值)以及当前代价的情况下前继步骤的选择。依次计算完所有步骤后,通过回溯的方法找到最优选择路径。符合这个模型的都可以用viterbi算法解决。https://blog.youkuaiyun.com/z...转载 2019-11-25 22:46:26 · 216 阅读 · 0 评论 -
EM算法推导
(1)初始化参数;(2)找一个Q函数,用初始化参数得到Q;(3)已知Q,最大化似然函数,更新参数;迭代(2)(3)步骤。https://blog.youkuaiyun.com/zouxy09/article/details/8537620q函数推导及BW算法:https://blog.youkuaiyun.com/firparks/article/details/54934112...转载 2019-11-25 16:46:44 · 163 阅读 · 0 评论