kaldi 声纹识别·资源汇总

最新推荐文章于 2024-03-04 16:12:13 发布

原创最新推荐文章于 2024-03-04 16:12:13 发布 · 置顶 · 1k 阅读

·

4

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

项目相关同时被 2 个专栏收录

37 篇文章

订阅专栏

37 篇文章

订阅专栏

kaldi 声纹识别·资源汇总

0. 如何学习kaldi
1. kaldi 基础
2. kaldi 进阶
- i-vector
- x-vector
3. kaldi 实战
4. 代码细节

0. 如何学习kaldi

知乎：语音识别kaldi该如何学习？——多去看看内容以及评论，捋一捋思路

1. kaldi 基础

Kaldi 初识：ppt
kaldi egs（使用样例表）
kaldi入门详解——aishell步骤解释

官方文档：
kaldi-asr.org/doc
Kaldi中文手册

2. kaldi 进阶

！！各个模块的深入理解：Kaldi中的plda的训练以及computer-socre（很详细，值得一看）

i-vector

kaldi-timit-sre-ivector

参考《TIMIT 数据集_声纹识别_kaldi》pdf 学习如何使用TIMIT数据集！

x-vector

Kaldi TIMIT x-vector 说话人识别 (声纹识别)——非常相关，值得好好看看，附带的github仓库中也适合去学习！(最好先学习前面的i-vector)
【kaldi】声纹识别之X-vector——介绍了Kaldi中现成的两个例子，非常值得学习！

3. kaldi 实战

语音识别从入门到放弃
 Kaldi 中的声纹识别
 初识语音识别及 Kaldi 的安装使用

kaldi中改写sre10/v1用timit dataset做说话人识别总结（来自语音识别kaldi该如何学习？ - Leon晋的回答 - 知乎）

4. 代码细节

绘制曲线

python 绘制声纹识别DET曲线

计算ERR

plda训练和打分

Kaldi中的plda的训练以及computer-socre(（从底层源码细致分析）——来自 jinmingz

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。