
语音信号处理算法
文章平均质量分 67
corgi_xx
语音信号处理,语音增强,声纹识别,音频工程
展开
-
keras LSTM 的几个重要参数
最近在做一个模型的实时化工作,包括CNN和LSTM的实时化,感觉里面坑挺多的,语音模型对实时性的要求真的苦了开发者了。我使用的是tensorflow 1.14进行开发,在1.14版本之后tensorflow支持keras 和tensorflow operator的混合编程,在更早的版本里面你要在keras 里面使用tensorflow的张量操作就得包装成Lambda层。今天主要介绍一下LSTM的实时性推理,主要的几个参数是stateful return_state和 unroll 。首先LS..原创 2021-01-23 14:09:47 · 6035 阅读 · 0 评论 -
二、从连续到离散:离散傅里叶变换
上一个博客https://blog.youkuaiyun.com/lxhdy12345/article/details/106319168介绍了音频领域的简单的基础知识,并提及了傅里叶变换。那么这一篇博客就重点介绍采样之后的离散序列如何使用傅里叶变换,这也是各种语音算法和前端处理的基础。 第一个重要的点是周期性抽样串及其傅里叶变换,我们之所以要提及周期性抽样串,是因为它是连续信号到离散信号的桥梁,而且由于其傅里叶变换也是一个频域的周期抽样串所以可以用来对信号进行离散和周期化。 ...原创 2020-07-06 16:09:04 · 6224 阅读 · 2 评论 -
windows 下kaldi配置
一个月前windows刚好宣传了WSL2对GPU的支持,虽然WSL一直因为对IO支持不佳被诟病,但是从简洁性来看还是很值得想学linux但又不想配置虚拟机的同学们的。刚好自己想在本地配置个kaldi,这里就介绍一下这一系列配置过程。 首先安装WSL,直接上microsoft store搜索ubuntu,下载第一个安装好之后,进入windows功能,将子系统功能打开,就可以使用了。 然后就是配置cuda和显卡驱动,...原创 2020-06-10 19:17:46 · 1394 阅读 · 0 评论 -
一、语音算法基础:采样、量化和频谱
想了很久该从哪里开头,那就从信号处理入手吧。原创 2020-05-26 11:39:18 · 4372 阅读 · 0 评论