- 博客(18)
- 资源 (15)
- 收藏
- 关注
原创 c++/c#实现mnist手写字符识别,包括模型训练、推理预测
利用c++/c#实现mnist手写字符识别,包括模型训练、推理预测,依赖简单,开箱即用,全部通过代码实现,支持二次开发,以及gpu加速。
2024-04-18 21:43:29
757
原创 声纹识别之xvector
TDNN时延神经网络(TDNN)来自1989年的论文《Phoneme recognition using time-delay neural networks》。原文中主要使用TDNN来识别音素,在识别"B", "D", "G"三个浊音中得到98.5%的准确率,高于HMM的93.7%。普通神经网络识别音素在讲TDNN之前先说说一般的神经网络的是怎样识别音素的吧。假设要识别三个辅音"B"...
2020-04-21 21:59:59
7940
4
原创 声纹识别资源汇总
Speaker Recognition2020Probabilistic embeddings for speaker diarization Deep Normalization for Speaker Vectors Bayesian x-vector: Bayesian Neural Network based x-vector System for Speaker Verifi...
2020-04-09 21:40:08
1014
1
原创 声纹识别SDK-FreeSR
FreeSR (A Free Library for Speaker Recognition),免费的声纹识别/性别识别SDK,支持Android/Windows/Linux等平台。1.实现算法: GMM-UBM I-Vector2.功能 说话人识别(验证),包括注册/识别两个阶段(GMM-UBM/I-Vector) 性别识别,根据语音片段判断性别(GMM-UBM...
2019-10-08 19:43:34
2773
5
原创 微软说话人识别工具箱(MSR Identity Toolbox)应用与实践教程
微软说话人识别工具箱1 (MSR Identity Toolbox) 是由微软研究院开 源的声纹识别工具,使用 MATLAB 语言编写。主要包含了 GMM-UBM 和 I-Vector 两种声纹识别核心算法源代码以及说明文档,但是并不涉及特征提 取、语音端点检测 (Voice Activity Detection, VAD) 等内容,对于初学者 来说想要使用该工具箱训练自己的模型并建立起完...
2019-05-22 21:15:57
3292
2
原创 声纹识别之Alize入门教程(四):matlab代码读取Spro工具提取的mfcc特征
Alize说话人识别工具箱使用的是语音信号处理工具SPro进行mfcc特征提取,对于WAV格式的音频,mfcc特征提取命令为:bin/sfbcep -m -k 0.97 -p19 -n 24 -r 22 -e -D -A -F wave test.wav test.tmp.prm保存的mfcc特征文件test.tmp.prm,前10个字节是非特征信息,每一帧的特征维度为60,读取代码如下:...
2019-05-16 21:01:34
1233
原创 基于C++实现的ivector说话人识别SDK
根据语音片段进行说话人识别的SDK,c/c++实现。利用ivector算法,进行说话人识别,包含了一个基础的ivector模型(6M),效果一般优于gmm-ubm算法。wav文件不要超过1M大小。1.WindowsWin10 and VS2013环境配置参考《说话人识别和说话人性别识别SDK-通过语音判断说话人,及说话人的性别》。因为ivector比gmm-ubm计算量更大,...
2019-04-09 20:16:52
1815
5
原创 说话人识别和说话人性别识别SDK-通过语音判断说话人,及说话人的性别
根据语音片段进行性别判断,以及说话人识别的SDK,c/c++实现。利用GMM-UBM算法,可以进行说话人识别,或者性别识别,可以参考<声纹识别之Alize入门教程(二):GMM-UBM>。进行性别识别的时候,将不同的性别视为不同的说话人即可。1.WindowsWin10 and VS2013。新建空项目=>选择项目,右键属性=>c/c++=>常规...
2019-04-03 20:07:42
4537
2
原创 声纹识别之Alize入门教程(三):I-vector
Alize完整的ivector例程,包括:数据准备、特征提取、训练以及测试等。最终生成的得分文件res/scores_PLDA_lengthnorm.txt,其含义参考GMM-UBM。M S0002 1 BAC009S0002W0122 0.644295M S0003 1 BAC009S0002W0122 0.520998M S0004 1 BAC009S0002W0122 0.4846...
2019-03-21 21:12:52
2916
10
原创 声纹识别之Alize入门教程(二):GMM-UBM
准备工作Alize官网https://alize.univ-avignon.fr有四个demo:1.GMM/UBM System2.I-vector System3.JFA System4.Top-down Speaker Segmenting and Clustering System下载第一个GMM-UBM例子01_GMM-UBM_system_with_ALIZE...
2019-03-20 20:40:13
6555
11
原创 声纹识别之Alize入门教程(一):环境配置
主要参考《说话人识别ALIZE工具包的编译》:http://www.cnblogs.com/yuersthe1/p/3671384.htmlwindows10vs20131.下载alize-core和LIA_RALhttps://github.com/ALIZE-Speaker-Recognition/LIA_RALhttps://github.com/ALIZE-Speake...
2019-03-18 20:19:07
3613
原创 声纹识别开源工具
声纹识别,也称为说话人识别,主要的开源工具有:1.MSR Identity Toolkit ,微软开源的工具箱,MATLAB版本,包含GMM-UBM和I-vector的demo,简单易用。下载地址2.Alize,主要包括GMM-UBM、I-vector andJFA三种传统的方法,C++版,简单易用。3.kaldi,当下十分流行的语音识别工具包,也包括声纹识别:覆盖了主流的声纹识别算...
2018-03-26 21:38:18
19787
5
c++/c#实现mnist手写字符识别,包括模型训练、推理预测
2024-04-18
c++/c#实现mnist手写字符识别,包括模型训练、推理预测
2024-04-18
ZlwAudioRecorder.rar
2020-04-02
android版本说话人性别识别以及声纹识别.rar
2019-05-24
基于ivector的说话人识别SDK
2019-04-09
基于Alize的ivector算法
2019-04-09
基于Alize的GMM-UBM算法
2019-04-09
说话人识别和说话人性别识别SDK
2019-04-04
Alize说话人识别工具在window平台的编译
2019-03-19
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人