- 博客(9)
- 收藏
- 关注
原创 声纹克隆:Self supervised learning for robust voice cloning
使用自监督特征和一大堆数据增强来实现声纹克隆
2022-05-06 10:03:20
518
原创 【ECAPA_TDNN 下 】代码和论文细节分析
ECAPA_TDNN代码和论文细节分析一、数据部分二、网络结构三、损失函数四、训练指标来源:INTERSPEECH 2020机构:比利时根特大学论文地址:源码地址:论文阅读博客:ECAPA_TDNN 上一、数据部分数据集:Voxceleb2 5994个说话人数据增强:每个话语生成6个额外的样本(1) 结合MUSAN(嘈杂的人声,噪声)数据集提供的RIR数据集(混响)生成三个。(2) 利用Sox (tempo up, tempo down)和ffmpeg (alternating opu
2022-04-21 15:31:11
7833
4
原创 VOCBENCH声码器评价基准
VOCBENCHFacebook在2021年发表的论文,为了解决vocoder评价过程中变量不同而导致的难以评价的问题。
2022-04-15 13:43:16
2450
原创 librosa相关error记录(持续记录)
使用的librosa版本是0.6.1。根据librosa文档可知,inverse只有在0.8.1版本上才有,将librosa升下级就好了。
2021-12-23 18:47:55
1099
1
原创 《算法图解》学习笔记
《算法图解》学习笔记 第一章 算法简介(二分查找,大O表示法)第二章 选择排序(数组和链表,选择排序)第三章 递归(递归,栈)第一节 递归第二节 栈第四章 快速排序(分而治之,快速排序,合并算法)第一节 分而治之(divide and conquer,递归式问题解决方法)第二节 快速排序(一种分而治之的算法)第三节 合并算法第五章 散列表第一节 散列函数第二节 应用案例第三节 冲突(collisi...
2020-02-02 20:33:29
642
原创 Finging tiny faces论文阅读笔记
《Finding Tiny Faces》论文阅读笔记 基础知识CNN(卷积神经网络)Resnet(深度残差学习网络)NMS(非极大值抑制)论文翻译(粗翻)摘要介绍Multi-tasking modeling of scalesHow to generalize pre-trained networks?How best to encode context?Our contribution相关工作尺...
2018-11-19 16:25:15
839
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人