
语音处理
Jellyfish733
菜鸟语音算法工程师
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
wav和pcm的转换(Python版本)
wav和pcm是语音信号处理中最常见的文件格式,时常会遇到需要两种文件格式的相互转换。wav存储的一般是解码后为[-1, 1]的float数据,文件头有44个字节记录文件的采样率、长度等等信息。pcm存储的是int型整数,不含任何采样率相关信息。虽然原理比较简单,但是整理后更便于利用。 wav转pcm 原理:将文件头去掉,数据转成int型即可。 import numpy as np ...原创 2020-03-23 18:29:42 · 10155 阅读 · 6 评论 -
SiSEC 2016 语音库
1、 test.zip1) 内容包含3种立体混合语音:(1) 瞬间混叠(通过正增益缩放的静态源)(2) 现场录音(在会议室用扬声器播放静态源,每一次用一对全向麦克风录一个源,再加一起形成混合源)Ps:因为SiSEC2015,我们不再评估“合成的混合卷积混合语音”(通过Roomsim 工具箱模拟的一对全向麦克风合成的房间瞬间脉冲响应过滤静态源???)(3)合成的混合卷积混合语音 ...原创 2018-03-22 11:52:39 · 950 阅读 · 0 评论