
Kaldi
RoadmanG
英国留学四年,音频算法工程师,主要研究方向在去混响,深度学习单/多通道降噪和回声消除
展开
-
第一次参加 CHiME-6 challenge 总结
第一次参加chime的自然场景多人对话远场语音识别评测主要负责数据增强和音频信号处理冲着高分去的,但由于symbol 出了最终结果并没有达到预期,有几点记录一下:1. GSS alignment在pb_chime5 需要改一下数据处理的不稳已经标注部分,但是chime-7大概率换了批数据,所以这个算法以后大概率不会在用到了,毕竟比现在的pit,danet等算法更不实用,出来的...原创 2020-04-15 10:34:07 · 3628 阅读 · 11 评论 -
MFCC一些知识与Kaldi中的MFCC特征解读
因为想用Kaldi去实现一个GMM-UBM的说话人识别和loglike打分,所以想把Kaldi计算的统计量对一对,看能不能把二进制文件里的数值单独拿出来,自己写个代码做结合Kaldi中的MAP做统计量计算,然后再放回去。 但是当把训练好的UBM打开看看,发现他的矩阵不是人们常说的MFCC生成的特征向量是39维而是60维,所以特意返回去再把MFCC和信号处理给梳理一遍。并且把ka...原创 2018-04-20 16:36:38 · 12485 阅读 · 18 评论 -
Kaldi中 声纹识别的流程图
总结了一波Kaldi中声纹识别的流程和所用的可执行文件,.把可执行文件当作一个库来用,自己来仿照这sre08,sre10,或者aishell的run.sh用自己的数据来完成自己的声纹识别系统就好.自己还在研究,但是说几个我认为比较关键的地方:1.gmm-gselect : 对每帧选择能取得最高likelihood的前n个分量, 其他的分量忽略. 返回的是这些分量的索引,后面计算的时候对于每帧只用这...原创 2018-05-15 12:30:45 · 10128 阅读 · 9 评论 -
PLDA的原理和em训练(为了be user friendly开始用latex写公式)
最近一直在学习和操作PLDA,感觉这个算法太有才了,对身份验证如人脸识别,声纹识别,OCR都有用. 先对自己的工作和面试别人以及被面试有一份感悟:1.数学太重要了,有些人看论文难啃的原因就是公式看不懂,公式看不懂就是数学不好,后面要慢慢补起来2.感觉工程能力太重要,不管是在工作中还是面试,算法最终能否实现还是要看你的手上的活.这是我的弱项,慢慢补3.很多面试官不管候选人简历,直...原创 2018-08-21 14:28:41 · 7725 阅读 · 1 评论 -
说话人识别/声纹识别学习路径的资料整理,从零学声纹识别
昨天帮新同事讲解了一波说话人识别的理论,并且帮他整理了资料让他学习,这个博客就是把最具有代表性的资料记录下来,前提,我假设你知道啥是MFCC,啥是VAD,啥是CMVN了.说话人识别学习路径无非就是 GMM-UBM -> JFA -> Ivector-PLDA -> DNN embeddings -> E2E首先 GMM-UBM, 最经典代表作: Speaker...原创 2018-09-12 12:09:57 · 10401 阅读 · 25 评论 -
Kaldi各种已经训练好的模型
做个记录http://kaldi-asr.org/models.html这网站是Kaldi中各种语音任务pretrained过的模型有视源ASR的, xvector做声纹识别的, emebedding做diarization的, 大部分是用LDC的死贵死贵的语料训练的直接把这些模型拿去解码或者拿去用都可以得出一个很不错的效果,我们在x-vector参加的NIST评测和自己实验的...原创 2018-10-15 12:29:05 · 9864 阅读 · 9 评论 -
Kaldi sre10, sre16 数据格式
做个记录, 给大多数跑脚本但是又没有官方数据的朋友一起交流讨论:引用自己在知乎的回答:跑kaldi的脚本到最后都是得用自己的数据去训练去测试的, kaldi只需要三个文件utt2spk, spk2utt和wav.scp.具体的你其实可以看看他们做数据的perl脚本,我个人是用python写一个脚本把数据集变成kaldi可读的格式的, 我代码弱智水平都能做,相信大牛的你们也没问题的....原创 2018-11-07 12:34:51 · 4115 阅读 · 17 评论 -
新的征程以及AISHELL x-vector跑分
从原来的公司跳槽去上海的一家新公司,不做声纹识别,要准备做语音识别了,新的开始,加油!在跳槽前用aishell数据重新训练了一个x-vector, 能达到0.8%的EER,相较于我自己测试的i-vector的5%有80%多的提高。下次把一些数据处理脚本开源。=================================================================...原创 2018-12-17 15:46:47 · 1409 阅读 · 15 评论