语音信号的短时语音能量

由于语音信号的能量随时间而变化,清音和浊音之间的能量差别相当显著,因此对短时能量和短时平均幅度进行分析,可以描述语音的这种特征变换情况。定义n时刻某语音信号的短时平均能量E为:

                              

式中,N为窗长,可见短时能量为一帧样点值的加权平方和。当窗函数为矩形窗时

                                                                                       

        短时平均能量用途:

       (1) 可以作为区分清音和浊音的特征参数;

       (2) 在信噪比比较高的情况下,短时能量可以作为区分有声和无声的依据;

       (3) 可以作为辅助的特征参数用于语音识别中。

       其中短时能量matlab代码如下: 

[plain]  view plain  copy
  在CODE上查看代码片 派生到我的代码片
  1. x = wavread('beijing.wav');  
  2. %计算N=50,帧移=20时的语音能量  
  3. s=fra(50,20,x);                 
  4. s2=s.^2;                    %一帧内各样点的能量  
  5. energy=sum(s2,2);            %求一帧能量  
  6. subplot(2,2,1);               %定义画图数量和布局   
  7. plot(energy);                %画N=50时的语音能量图  
  8. xlabel('帧数');               %横坐标  
  9. ylabel('短时能量 E');         %纵坐标  
  10. legend('N=50');              %曲线标识  
  11. axis([0,1500,0,2*10^10]);      %定义横纵坐标范围  

取不同帧时能量如下图:

                                                                           

其中,fra()为分帧函数,matlab代码如下:

[plain]  view plain  copy
  在CODE上查看代码片 派生到我的代码片
  1. function f=fra(len,inc,x)  
  2. fh=fix(((size(x,1)-len)/inc)+1)  
  3. f=zeros(fh,len);  
  4. i=1;n=1;  
  5. while i<=fh  
  6.     j=1;  
  7.     while j<=len  
  8.         f(i,j)=x(n);  
  9.         j=j+1;n=n+1;  
  10.     end  
  11.     n=n-len+inc;  
  12.     i=i+1;  
  13. end  
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值