
音频
文章平均质量分 66
赵至柔
这个作者很懒,什么都没留下…
展开
-
基于Python的MORSE音频的波形和频谱
1、需求分析 现有一个MORSE.wav的音频文件,要求使用Python读取该文件画出其波形和频谱。2、代码实现import waveimport numpy as npimport pylab as pl#打开wav文件 ,open返回一个的是一个Wave_read类的实例,通过调用它的方法读取WAV文件的格式和数据。f = wave.open(r"E:\团队文件\音...原创 2018-04-09 15:56:25 · 2378 阅读 · 0 评论 -
基于MATLAB和Python的短时平均过零率检验
1、需求分析 采用五种基本波形进行短时平均过零率算法的检测。生成一段5s的波形,采样频率均为8000Hz:1、正弦波:幅值:0.5V,频率:1kHz;2、全0波形;3、正弦波:幅值:0.5V,频率:2kHz;4、正弦波:幅值:0.5V,频率:3kHz;5、噪声。 注意 :因为生成.wav文件后,MATLAB和python读取WAV文件时全零波形会产生误差,读入后不再是全零波形,所以这里...原创 2018-05-14 16:19:37 · 4094 阅读 · 2 评论 -
Python音频处理包——Librosa的安装与使用
Python音频处理库—librosa的安装与使用1、librosa简介 Librosa是一个用于音频、音乐分析、处理的python工具包,一些常见的时频处理、特征提取、绘制声音图形等功能应有尽有,功能十分强大。本文主要介绍librosa的安装与使用方法。 librosa的安装与使用文档 https://librosa.github.io/librosa/ins...原创 2018-05-16 10:29:56 · 36139 阅读 · 2 评论 -
Python中使用librosa包进行mfcc特征参数提取
Python中有很多现成的包可以直接拿来使用,本篇博客主要介绍一下librosa包中mfcc特征函数的使用。1、电脑环境电脑环境:Windows 10 教育版Python:python3.62、需要了解的知识librosa包的介绍与安装见博主另一篇博客: https://blog.youkuaiyun.com/qq_39516859/article/details/80333431 梅...原创 2018-06-13 15:26:01 · 44934 阅读 · 8 评论 -
声音的三要素跟声波的幅度、频率和频谱的对应关系
声音的特性可由三个要素来描述,即响度、音调和音色。1、音调声音的高低称为音调。音调取决于声源振动的频率。物体在1秒内振动的次数叫频率。其单位是赫兹,简称赫,符号为Hz。物体振动得越快,频率越大。音调跟发声体振动的频率关系是:频率越大,音调越高;频率越小,音调越低。2、响度人耳对声音强弱的主观感觉称为响度,响度又称音量。响度跟声源的振幅以及人距离声源的远近有关。 响度与振幅的...原创 2018-06-01 11:10:01 · 38960 阅读 · 0 评论 -
梅尔频率倒谱系数(MFCC)资源
总结一些关于MFCC写的比较好的资源:1.MFCC提取过程讲解的非常详细,形象(图表多):http://blog.youkuaiyun.com/zouxy09/article/details/91567852.MFCC原理上讲解的很简洁,有基于MATLAB和HTK的实现代码:http://blog.youkuaiyun.com/jojozhangju/article/details/186788613...原创 2018-06-11 10:01:48 · 2621 阅读 · 1 评论 -
Mel滤波器组的设计与实现(基于MATLAB和Python)
Mel滤波器组的设计与实现(基于MATLAB和Python)1、Mel滤波器组介绍在语音的频谱范围内设置若干带通滤波器Hm(k),0≤m<MHm(k),0≤m<M{{H}_{m}}\left( k \right),0\le mMMM 为滤波器的个数。每个滤波器具有三角形滤波特性,其中心频率为f(m)f(m)f(m) ,在Mel频率范围内,这些滤波器是等带宽的。每个带通滤波器...原创 2018-06-26 14:59:31 · 19410 阅读 · 18 评论 -
基于MFCC参数的元音识别
基于MFCC参数的元音比对一、需求分析利用MFCC参数,对元音进行比对。读取每个元音的WAV文件,然后进行分帧,这里分帧的时候将重叠部分设置为0,即帧长wlen=256,帧移inc=256。每帧有256个数。比对内容:1、同一个WAV文件的不同两帧进行对比;2、不同WAV文件的两帧进行对比。比对方法:1、将两帧中每帧的12个mfcc参数相减,相减后求绝对值,画出波形,观察;2、...原创 2018-07-02 09:25:53 · 1940 阅读 · 0 评论 -
截取音频中的其中一段(基于短时能量的方法)
元音音频截取一、需求分析现有一段元音音频,有无话段和语音段,现需要截取语音段的中间部分。二、流程三、具体步骤1、能量归一化求出整段音频的能量,再将这段音频的每个点除以[Math Processing Error]a\sqrt{a}: [Math Processing Error]En=∑0Nx2En=\sum\limits_{0}^{N}{{ x ^{2}}}...原创 2018-07-17 16:58:48 · 8133 阅读 · 3 评论 -
ffmpeg命令 音频文件格式转换
具体命令1.转MP3为wavffmpeg -i input.mp3 -acodec pcm_s16le -ac 1 -ar 8000 output.wav2.转m4a为wavffmpeg -i input.m4a -acodec pcm_s16le -ac 1 -ar 8000 output.wav3.wav与PCM的相互转换ffmpeg -iinput.wav -f s16le -a...原创 2019-01-02 14:40:53 · 16528 阅读 · 0 评论 -
在MATLAB中添加语音处理工具箱(voicebox)
1. voicebox介绍 voicebox是一个MATLAB中的语音处理工具箱,支持MATLAB6.5以上的版本。其中包含了对语音的分帧处理,滤波,加窗,参数提取等等函数,是语音识别几乎不可缺少的一个工具箱。网站: http://www.ee.ic.ac.uk/hp/staff/dmb/voicebox/voicebox.html 这个网站包括了voicebox的介绍和下载包 。...原创 2018-05-10 10:52:44 · 44581 阅读 · 15 评论 -
Python音频特征提取——pyAudioAnalysis工具包
语音识别等应用离不开音频特征的提取,最近在看音频特征提取的内容,用到一个python下的工具包——pyAudioAnalysis: An Open-Source Python Library for Audio Signal Analysis,该工具包的说明文档可以点击这里下载,对应的github链接点击这里。这个工具包原说明文档支持的是Linux安装,且不能与python3很好地兼容,注意啦...原创 2018-05-03 12:54:56 · 25157 阅读 · 4 评论 -
基于Python的QPSK音频的波形和频谱
1、需求分析 现有一个QPSK.wav的音频文件,要求使用Python读取该文件画出其波形和频谱。2、代码实现import waveimport numpy as npimport pylab as pl#打开wav文件 ,open返回一个的是一个Wave_read类的实例,通过调用它的方法读取WAV文件的格式和数据。f = wave.open(r"E:\团队文件\...原创 2018-04-09 18:27:55 · 3595 阅读 · 1 评论 -
基于Python的BPSK音频的波形和频谱
1、需求分析 现有一个BPSK.wav的音频文件,要求使用Python读取该文件画出其波形和频谱。2、代码实现import waveimport numpy as npimport pylab as pl#打开wav文件 ,open返回一个的是一个Wave_read类的实例,通过调用它的方法读取WAV文件的格式和数据。f = wave.open(r"E:\团队文件\...原创 2018-04-10 09:31:49 · 3164 阅读 · 0 评论 -
MATLAB和Python读取wave文件的波形对比
用python读取.wav文件的波形后再用MATLAB读取文件波形进行验证。1、MORSE1.1 Python程序见之前的博客。 波形如图1所示: 图11.2 MATLAB读取波形程序如下:>>[test, fs] = audioread('E:\团队文件\音频\MORSE.wav');plot(test) %画出MORSE的波...原创 2018-04-10 12:42:44 · 4440 阅读 · 0 评论 -
使用python读取wav格式文件
1、wav格式文件 WAV为微软公司(Microsoft)开发的一种声音文件格式,它符合RIFF(Resource Interchange File Format)文件规范,用于保存Windows平台的音频信息资源,被Windows平台及其应用程序所广泛支持,该格式也支持MSADPCM,CCITT A LAW等多种压缩运算法,支持多种音频数字,取样频率和声道,标准格式化的WAV文件和CD格式...原创 2018-04-04 16:44:19 · 24317 阅读 · 1 评论 -
基于Python的MORSE音频的波形和频谱(二)
1、需求分析 现有一个MORSE.wav的音频文件,要求使用Python读取该文件画出其波形和频谱。2、代码实现#coding:utf-8import waveimport numpy as npfrom scipy.fftpack import fft,ifftimport matplotlib.pyplot as pltimport seaborn#打开wav...原创 2018-04-11 21:45:56 · 1844 阅读 · 2 评论 -
使用python写Wave文件
1、Wave文件 WAV是Microsoft开发的一种声音文件格式,虽然它支持多种压缩格式,不过它通常被用来保存未压缩的声音数据(PCM脉冲编码调制)。WAV有三个重要的参数:声道数、取样频率和量化位数。声道数:可以是单声道或者是双声道采样频率:一秒内对声音信号的采集次数,常用的有8kHz, 16kHz, 32kHz, 48kHz, 11.025kHz, 22.05kHz, 44....原创 2018-04-06 15:43:16 · 17612 阅读 · 0 评论 -
基于MATLAB的语音信号的时域特性分析(一)——分帧、窗函数
语音信号是一个非稳态的。时变的信号。但在“短时间”范围内可以认为语音信号是稳态的、时不变的。这个短时间一般值10~30ms。由于有这个特性,故常把语音信号称为“准稳态”的信号。这个“准稳态”的特性构成了语音信号的“短时分析技术”。 在短时分析中,将语音信号分为一段一段地来分析其特征参数,其中每一段称为一“帧”,帧长一般取10~30ms。这样,对于整体的语音信号来讲,每一帧特征参数组成了...原创 2018-05-02 12:50:13 · 26075 阅读 · 2 评论 -
基于MATLAB的语音信号的时域特性分析(二)——短时能量、短时平均过零率
语音信号分帧以后,可以在时域中处理,也可以在频域中处理。这里主要介绍时域处理中提取语音信号的特性。 设语音波形时域信号为x(n)x(n)x(n) 、加窗函数w(n)w(n)w(n) 分帧处理后得到的第i帧语音信号为yi(n)yi(n){{y}_{i}}(n),则yi(n)yi(n){{y}_{i}}(n) 满足: yi(n)=w(n)∗x((i−1)∗inc+n),1≤n≤L,1≤i≤...原创 2018-05-02 15:40:02 · 28756 阅读 · 27 评论 -
SoX 音频处理工具使用方法
一、简介SoX 可以读取和写入常见格式的音频文件,并在此过程中选择性的加入一些声音效果。它可以组合多个输入源及合成音效,在许多系统上也可以作为音频播放器或多轨录音机使用。SoX 工具在大部分 Linux 系统上都可以直接通过软件包管理器安装(如sudo apt-get install sox),Mac 系统上则可以使用 brew install sox命令。SoX 处理音频的基本流程如下:...原创 2019-02-27 17:00:36 · 27923 阅读 · 0 评论