- 博客(2)
- 收藏
- 关注
原创 Spleeter工具简单分析
源码地址:https://github.com/deezer/spleeterpytorch版本:https://github.com/generalwave/spleeter.pytorch前言 spleeter是一款基于深度学习的多音轨分离软件。其使用python3.7基于tensorflow1.15版本编写。本文给出了spleeter的pytorch版本,并将官方预训练模型转化为pytorch模型。该版本经验证效果与官方版本一致。 从功能上,目前预训练模型为2stems(分离出人声/
2020-07-14 10:03:58
12432
14
原创 男女声分类研究及应用
背景在很多业务场景下,确定发声人的性别都是很有用的。人类可以很轻松的通过一段语音确定发声者的性别,但是人的成本以及效率是比较低的。此时,假如机器可以完成这项工作的,将极大的解放人力提升效率。研究过程算法方案特征的选择使用在自动语音和说话人识别中广泛使用的MFCC特征。因为男女声的最明显的差异在音色,而音色在音频上表现为其共振峰分布。MFCC特征[1]是使用频谱包络(连接所有共振峰值点的平滑曲线)再经过基于人耳听觉实验获取到的三角滤波器组,过滤掉一些人耳不敏感的频率分量之后得到。因此,使用MFCC特征
2020-06-03 14:39:57
1945
3
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人