在介绍前,我们有必要先明确语音信号的几个参数信息。
采样频率 rate:每秒采几个点,原始语音信号为连续信号,在一秒的波形上采的点越多,保真性就越高。
采样位数 format:即采样值的编码位数,计算机存储信息都在用二进制编码,位数越多,保真性越高。一般为8bit,16bit。
码率 比特率:即每秒传输的数据量。
pyaudio 模块保存.wav音频文件。
import pyaudio
import wave
CHUNK = 1024
FORMAT = pyaudio.paInt16
CHANNELS = 2
RATE = 44100
RECORD_SECONDS = 5
WAVE_OUTPUT_FILENAME = "output.wav"
p = pyaudio.PyAudio