自然科学.IT辑(音视频开发)
Lucas23
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Real-Time-Voice-Cloning 安装使用笔记
Real-Time-Voice-Cloning 安装使用Real-Time-Voice-Cloning 是“Transfer Learning from Speaker Verification to Multispeaker Text-To-Speech Synthesis(SV2TTS)”论文的实现,这是一个三阶深度学习框架,允许从几秒钟的音频中创建一个数字化的语音,并使用它来调节训练的“文本转语音”模型,以推广到新的声音.源码地址:https://github.com/CorentinJ/Re原创 2020-08-03 17:19:53 · 12736 阅读 · 3 评论 -
tacotron-2 安装及使用笔记
安装Tensorflow 版本及对应的CUDN.https://tensorflow.google.cn/install/sourceCUDA安装CUDA下载链接下载文件示例格式cuda_10.0.130_410.48_linux.run使用命令sh cuda_10.0.130_410.48_linux.run来安装此文件按照提示一步一步走安装完成后用命令检查是否安装成功cat /usr/local/cuda/version.txt即可查看cuda版本或者是输入...原创 2020-12-08 20:29:42 · 2946 阅读 · 0 评论 -
基于最小均方误差短时谱估计的语音增强
1 基于最小值控制的噪声估计Cohen 和 Berdugo 提出了一种基于最小值控制的递归平均(MCRA: Minima Controlled Recursive Averageing)方法来估计噪声。该方法由带噪语音的局部能量值与一定时间范围内的最小值的比较判断某个子带(频点)是否存在语音。如果该子带存在语音则不更新噪声谱,如果不存在则跟带噪语音的功率谱进行加权更新。具体实现流程: 1...原创 2018-03-21 20:25:25 · 3829 阅读 · 2 评论 -
WEBRTC中VAD算法及思想的数学解析
1 子带划分滤波器 SplitFilter1.1 全通滤波器 AllPassFilter从函数中tmp32 = state32 + filter_coefficient * *data_in;state32 = (*data_in * (1 &原创 2018-11-21 21:11:48 · 9883 阅读 · 10 评论 -
基于FEC信道编码丢包恢复技术
FEC 前向差错恢复编码FEC 是一种前向差错恢复编码技术,是通过对原生信息序列进行编码生成监督码,这些监督码作为冗余信息序列与原生信息序列一起被传输,当原生信息序列发生错误或丢失,可通过冗余信息序列以一定能力恢复原生信息序列。 对于生成的冗余数据,我们希望生成数据大小范围与原生数据一致,以免使用更多冗余来表示,比如在计算机中,以一个字节单位的数据来生成的编码数据我们不希望是个两个字节或更大...原创 2017-11-02 19:39:23 · 2135 阅读 · 1 评论 -
最小均方自适应滤波器
自适应滤波器自适应滤波器由参数可调的数字滤波器和自适应算法两部分组成。数字滤波器可以是有限型FIR或无限型IIR。IIR滤波器有正向通路和反馈通路,可能产生不稳定信号导致滤波器振荡,而FIR只有正向通路,处理简单,在自适应滤波中,一般采用FIR滤波器。自适应滤波器实际是一种能够跟踪输入信号的统计特性变化,按照最优滤波准则,调节自身参数的,计算最优滤波效果的特殊维纳滤波器。最优滤...原创 2017-09-26 15:42:33 · 4315 阅读 · 1 评论
分享