
声纹识别
NonDay
这个作者很懒,什么都没留下…
展开
-
C++搭建http服务实现声纹识别
使用c++搭建声纹(说话人和说话人性别)识别服务。原创 2021-08-12 22:15:54 · 811 阅读 · 0 评论 -
声纹识别之xvector
TDNN时延神经网络(TDNN)来自1989年的论文《Phoneme recognition using time-delay neural networks》。原文中主要使用TDNN来识别音素,在识别"B", "D", "G"三个浊音中得到98.5%的准确率,高于HMM的93.7%。普通神经网络识别音素在讲TDNN之前先说说一般的神经网络的是怎样识别音素的吧。假设要识别三个辅音"B"...原创 2020-04-21 21:59:59 · 7958 阅读 · 4 评论 -
声纹识别资源汇总
Speaker Recognition2020Probabilistic embeddings for speaker diarization Deep Normalization for Speaker Vectors Bayesian x-vector: Bayesian Neural Network based x-vector System for Speaker Verifi...原创 2020-04-09 21:40:08 · 1018 阅读 · 1 评论 -
声纹识别SDK-FreeSR
FreeSR (A Free Library for Speaker Recognition),免费的声纹识别/性别识别SDK,支持Android/Windows/Linux等平台。1.实现算法: GMM-UBM I-Vector2.功能 说话人识别(验证),包括注册/识别两个阶段(GMM-UBM/I-Vector) 性别识别,根据语音片段判断性别(GMM-UBM...原创 2019-10-08 19:43:34 · 2780 阅读 · 5 评论 -
微软说话人识别工具箱(MSR Identity Toolbox)应用与实践教程
微软说话人识别工具箱1 (MSR Identity Toolbox) 是由微软研究院开 源的声纹识别工具,使用 MATLAB 语言编写。主要包含了 GMM-UBM 和 I-Vector 两种声纹识别核心算法源代码以及说明文档,但是并不涉及特征提 取、语音端点检测 (Voice Activity Detection, VAD) 等内容,对于初学者 来说想要使用该工具箱训练自己的模型并建立起完...原创 2019-05-22 21:15:57 · 3297 阅读 · 2 评论 -
声纹识别之Alize入门教程(四):matlab代码读取Spro工具提取的mfcc特征
Alize说话人识别工具箱使用的是语音信号处理工具SPro进行mfcc特征提取,对于WAV格式的音频,mfcc特征提取命令为:bin/sfbcep -m -k 0.97 -p19 -n 24 -r 22 -e -D -A -F wave test.wav test.tmp.prm保存的mfcc特征文件test.tmp.prm,前10个字节是非特征信息,每一帧的特征维度为60,读取代码如下:...原创 2019-05-16 21:01:34 · 1236 阅读 · 0 评论 -
说话人识别和说话人性别识别SDK-通过语音判断说话人,及说话人的性别
根据语音片段进行性别判断,以及说话人识别的SDK,c/c++实现。利用GMM-UBM算法,可以进行说话人识别,或者性别识别,可以参考<声纹识别之Alize入门教程(二):GMM-UBM>。进行性别识别的时候,将不同的性别视为不同的说话人即可。1.WindowsWin10 and VS2013。新建空项目=>选择项目,右键属性=>c/c++=>常规...原创 2019-04-03 20:07:42 · 4547 阅读 · 2 评论 -
基于C++实现的ivector说话人识别SDK
根据语音片段进行说话人识别的SDK,c/c++实现。利用ivector算法,进行说话人识别,包含了一个基础的ivector模型(6M),效果一般优于gmm-ubm算法。wav文件不要超过1M大小。1.WindowsWin10 and VS2013环境配置参考《说话人识别和说话人性别识别SDK-通过语音判断说话人,及说话人的性别》。因为ivector比gmm-ubm计算量更大,...原创 2019-04-09 20:16:52 · 1819 阅读 · 5 评论 -
声纹识别之Alize入门教程(一):环境配置
主要参考《说话人识别ALIZE工具包的编译》:http://www.cnblogs.com/yuersthe1/p/3671384.htmlwindows10vs20131.下载alize-core和LIA_RALhttps://github.com/ALIZE-Speaker-Recognition/LIA_RALhttps://github.com/ALIZE-Speake...原创 2019-03-18 20:19:07 · 3617 阅读 · 0 评论 -
声纹识别之Alize入门教程(三):I-vector
Alize完整的ivector例程,包括:数据准备、特征提取、训练以及测试等。最终生成的得分文件res/scores_PLDA_lengthnorm.txt,其含义参考GMM-UBM。M S0002 1 BAC009S0002W0122 0.644295M S0003 1 BAC009S0002W0122 0.520998M S0004 1 BAC009S0002W0122 0.4846...原创 2019-03-21 21:12:52 · 2922 阅读 · 10 评论 -
声纹识别之Alize入门教程(二):GMM-UBM
准备工作Alize官网https://alize.univ-avignon.fr有四个demo:1.GMM/UBM System2.I-vector System3.JFA System4.Top-down Speaker Segmenting and Clustering System下载第一个GMM-UBM例子01_GMM-UBM_system_with_ALIZE...原创 2019-03-20 20:40:13 · 6563 阅读 · 11 评论 -
声纹识别开源工具
声纹识别,也称为说话人识别,主要的开源工具有:1.MSR Identity Toolkit ,微软开源的工具箱,MATLAB版本,包含GMM-UBM和I-vector的demo,简单易用。下载地址2.Alize,主要包括GMM-UBM、I-vector andJFA三种传统的方法,C++版,简单易用。3.kaldi,当下十分流行的语音识别工具包,也包括声纹识别:覆盖了主流的声纹识别算...原创 2018-03-26 21:38:18 · 19807 阅读 · 5 评论