
说话人识别
干塘村speecher
语音识别、说话人识别
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
MKL相关知识(kaldi安装MKL可以用ATLAS代替)
BLAS BLAS的全称是Basic Linear Algebra Subprograms,中文可以叫做基础线性代数子程序。它定义了一组应用程序接口(API)标准,是一系列初级操作的规范,如向量之间的乘法、矩阵之间的乘法等。许多数值计算软件库都实现了这一核心。 BALS是用Fortran语言开发的,Netlib实现了BLAS的这些API接口,得到的库也叫做BLAS。Netlib只是一般性地实现...转载 2019-09-10 20:59:56 · 2327 阅读 · 0 评论 -
kaldi下yesno的脚本说明
在Kaldi的egs文件下有很多基于公共语音数据库的训练步骤及测试结果,其中也有中文的,本文就相对很简单的yesno样例结合脚本以及脚本运行结果进行详细的解析,以更好地理解语音识别的整体流程。 总括 我们先来看一下run.sh脚本: cd ./egs/yesno/s5/ vi run.sh =================================================...转载 2019-09-11 23:01:19 · 559 阅读 · 0 评论 -
语音特征参数MFCC提取过程详解
原博客地址:https://blog.youkuaiyun.com/jojozhangju/article/details/18678861 自己刚刚学习说话人识别,在网上找了一些关于MFCC特征的博文,感觉这篇将得十分不错,在此感谢这位博主。转载此篇宫以后学习、复习。如果人想继续转载,请注明原博文地址:https://blog.youkuaiyun.com/jojozhangju/article/details/18...转载 2019-10-03 00:04:47 · 956 阅读 · 0 评论 -
批量升降采样率(wav文件)
刚开始学习说话人识别,刚刚看了点shell脚本的东西,师兄就让我写一个脚本对数据进行升降采样处理,自己用了最简单的方式,递归遍历一遍文件夹的wav文件,然后对每一个wav文件执行升降采样命令,此为记录性学习,请大佬们不吝赐教! 降采样命令用到了sox处理语音工具,其相应命令,大家可以点击http://sox.sourceforge.net/sox.html、http://billposer.o...原创 2019-10-05 20:14:50 · 896 阅读 · 0 评论