
语音信号预处理
文章平均质量分 58
吃块小西瓜
这个作者很懒,什么都没留下…
展开
-
matlab批量将mp3文件转wav文件
matlab批量MP3文件转wav文件原创 2022-10-07 19:54:15 · 952 阅读 · 1 评论 -
python实现对语音信号的离散余弦变换(DCT)与离散余弦逆变换(IDCT)
python实现对语音的离散余弦变换与离散余弦逆变换离散余弦变换离散余弦逆变换调包实现离散余弦变换离散余弦变换(DCT)信号谱分量丰富、能量集中,且不需要对语音相位进行估算等优点,在较低的运算复杂度下取得较好的语音增强效果。假设一余弦序列x(n)=cos(2πfnfs),0<=n<1000x(n)=\cos(\frac{2\pi fn}{{f}_{s}}), 0<=n<1000x(n)=cos(fs2πfn),0<=n<1000其中f=50Hz,fs{原创 2021-08-29 21:36:39 · 3433 阅读 · 0 评论 -
python实现语音信号的语谱图
python实现语音信号的语谱图语音读取出来之后使用函数实现:import numpy as npimport waveimport matplotlib.pyplot as plt # 导入绘图工作的函数集合# 读入音频。f = wave.open('E:\MatBook应用\mvoice resource\Aa.wav','rb')params = f.getparams() # 一次性返回所有的音频参数,声道数、量化位数、采样频率、采样点数print('显示参数', params)原创 2021-08-04 14:38:25 · 931 阅读 · 0 评论 -
python绘出语音信号的倒谱图
python画语音信号的倒谱图求信号x(n)的倒谱:1)对信号x(n)作傅里叶变换,得到信号的复数谱X(w)=FT[x(n)]X(w)=FT[x(n)]X(w)=FT[x(n)]2)对信号的复数谱只取实数部分然后再取对数得到对数幅值谱X¨(w)=ln[∣X(w)∣]\ddot{X}(w)=ln[|X(w)|]X¨(w)=ln[∣X(w)∣]3)对对数幅值谱进行逆傅里叶变换,得到倒频谱读取语音文件并画出语音信号的倒谱图。import numpy as npimport waveim原创 2021-08-04 14:29:14 · 2184 阅读 · 0 评论 -
Python实现语音信号的短时平均过零率
短时平均过零率平均过零率:短时平均过零率表示的是一帧语音中语音信号波形穿过横轴也就是零电平的次数,也可以理解为样本数值改变符号的次数。若语音信号分帧以后为 yi(n){y}_{i} (n)yi(n),帧长为L,则短时平均过零率可以表示为:Z(i)=12∑n=0L−1∣sgn[yi(n)]−sgn[yi(n−1)]∣1<=i<=fn Z(i) = \frac{1}{2} \sum_{n=0}^{L-1} |sgn[{y}_{i}(n)]-sgn[{y}_{i}(n-1)]| \quad原创 2021-06-07 15:43:06 · 1641 阅读 · 0 评论 -
python实现语音信号的分帧、加窗、预处理
语音信号实现分帧、加窗、预处理音频文件读取预加重分帧加窗音频文件读取librosa是非常强大的python语音信号处理库。读取音频:使用语句librosa.load(path, sr=22050, mono=True, offset=0.0, duration=None)读取音频文件,默认的采样率是22050,若要保留音频的原始采样率,使用sr=None。其中:path:表示音频文件的路径sr:表示采样率mono:bool,是布尔类型,表示是否将信号转换为单声道offset:float,后原创 2021-04-12 21:40:14 · 15606 阅读 · 13 评论