
Speex
文章平均质量分 91
叶夜笙歌
关注IT、智能硬件行业,专业语音信号处理,在此记录整理一些东西,让自己理解更深,也让大家分享,错漏之处,不吝赐教。
展开
-
Speex手册(三)——编解码器描述2与编译和端口
2.2 编解码器 Speex的主要特性有: 1)免费软件/开源,免专利费和版税 2)利用嵌入比特流集成了窄带和宽带 3)大范围可用比特率(从2.15kbps到44kbps) 4)动态比特率转换(AMR)和可变比特率操作(VBR) 5)声音活动检测(V翻译 2014-02-03 06:23:55 · 2513 阅读 · 0 评论 -
Speex手册(九)——代码示例
这部分展示运用Speex API编码和解码语音的代码示例,可通过调用如下指令编码和解码一个文件: % sampleenc in_file.sw | sampledec out_file.sw其中的文件都是每个样本16比特编码(机器自然字节顺序)的原始文件(无文件头)。A.1 sampleenc.c sampleenc读取一个原翻译 2014-02-23 15:45:34 · 3084 阅读 · 0 评论 -
Speex手册(二)——Speex介绍和编解码器描述1
1 Speex介绍 Speex编解码器(http://www.speex.org/)的存在是因为需要一款开源且免软件专利使用费的语音编解码器,这是任何开源软件可用的必要条件。本质上来说,Speex相对于语音正如Vorbis(注:免费音乐格式)相对于音频/音乐。不像许多其他语音编解码器,Speex不是为移动电话而设计,而是为分封网络(packet network)和网络电话(Vo翻译 2014-02-02 01:25:53 · 3793 阅读 · 0 评论 -
Speex手册(七)——CELP编码介绍
8 CELP编码介绍 Speex基于CELP,即码激励线性预测(Code Excited Linear Prediction)。本章介绍CELP基本原理,所以如果你已经对CELP很熟悉,可以跳到第9章。CELP技术基于以下3点思想: 1)利用一个线性预测(LP)模型模拟声道 2)使用(自适应的和固定的)密码本条翻译 2014-02-17 17:06:23 · 7873 阅读 · 0 评论 -
Speex手册(八)——Speex窄带模式和Speex宽带模式
9 Speex窄带模式 这章介绍Speex如何在窄带(8kHz采样率)操作。这一模式下帧大小为20ms,对应160个采样点。每一帧又分成4个子帧,每个子帧40个采样点。 许多设计决策基于如下的初衷和假设: 1)使从先前帧提取的信息数量最小化(为了对丢包具有鲁棒性) 2)动态可选择的码本(LSP翻译 2014-02-23 10:23:28 · 4482 阅读 · 0 评论 -
Speex手册(一)——目录
之前在研究声学回声消除时接触到了Speex,用到其中回声消除API,在远端与近端声音信号同步且远端回声不是特别大时回声消除效果不错,但不同步时效果非常差,因为回声消除用的是NLMS算法,不同步就很难收敛。最近在做异常声音检测时,又用到了声音预处理和语音活动检测的一些API,参数设置的合适,检测效果也不错。鉴于多次用到Speex,故索性将官方手册(The Speex Codec Manual Ver翻译 2014-02-01 04:05:41 · 3217 阅读 · 0 评论 -
Speex手册(六)——语音处理API(2)与格式和标准
6.3 抖动缓冲器 启用抖动缓冲器,需要包含头文件: #include 然后初始化一个新的抖动缓冲器: JitterBuffer *state = jitter_buffer_init(step);其中step参数是默认时间步长(单位为时间戳的单位),用来调整延时和做隐蔽,合适的值为1,有时更大的值更好翻译 2014-02-07 01:28:53 · 4478 阅读 · 0 评论 -
Speex手册(五)——Speex编解码器API(2)和语音处理API(1)
5.4 模式查询 Speex模式查询类似于speex_encoder_ctl和speex_decoder_ctl函数调用。因为模式是只读的,所以仅能获取一个特别模式的信息。函数调用如下: void speex_mode_query(Speexmode *mode, int request, void *ptr); 其中requ翻译 2014-02-06 04:33:56 · 4654 阅读 · 1 评论 -
Speex手册(四)——命令行编码器/解码器和Speex编码器API(1)
4 命令行编码器/解码器 Speex最基本的是命令行编码器(speexenc)和解码器(speexdec)。这些工具产生并读取封装在Ogg容器内的Speex文件。尽管能在任意容器内封装Speex,但Ogg是文件命令行容器。这一部分介绍如何在Ogg中为Speex文件使用命令行工具。4.1 speexenc speexenc的作用是从未加工的PCM文件或wa翻译 2014-02-04 03:48:27 · 5333 阅读 · 0 评论 -
基于Speex的声学回声消除
所谓声学回声消除,是为了解决VoIP(网络电话)中这样一个问题:即A与B进行通话,A端有麦克风和扬声器分别用来采集A的声音和播放B的声音,B端有麦克风和扬声器分别用来采集B的声音和播放A的声音,很明显,由于声音传播的特性,A端的麦克风在采集A的声音的同时,也采集到了A端扬声器播放的来自B的声音,也就是A端采集到的声音是一个混合的声音,这个声音通过网络发给B时,B就不仅能听到A的声音,也能听见B前几原创 2014-02-26 15:40:05 · 11644 阅读 · 6 评论