16、音频处理:测量、特征提取、模拟与MIDI技术

音频处理:测量、特征提取、模拟与MIDI技术

1. 音频测量与特征提取

1.1 音高(Pitch)

音高是声音的一种感知属性,它取决于声音的频率。低频声音(如鼓声)音高较低,而高频声音(如哨声)音高较高。音高可以通过基频和泛音的数量来量化。在音频处理中,可以使用AST函数 pitch 来估计音频信号的基频。该函数会返回估计值及其位置。

下面是一个示例代码,用于估计音频信号中的音高:

clear; clc;
[a,fs] = audioread('SpeechDFT-16-8-mono-5secs.wav');
[f0, idx] = pitch(a, fs);
subplot(211), plot(a); ylabel('Amplitude');
subplot(212), plot(idx, f0); ylabel('Pitch (Hz)'); xlabel('Sample Number')

1.2 语音活动检测(Voice Activity Detection, VAD)

语音活动检测是语音处理中用于检测音频信号中是否存在人类语音的技术。为了分析随时间变化的音频信号,音频会被分割成称为音频帧的片段,然后分别分析每个帧中是否存在语音部分。VAD系统通常会从每个音频帧中提取特征,然后根据分类规则将每个片段分类为包含语音或不包含语音。

典型的VAD系统应用包括语音/说话人识别和语音激活系统。AST函数 voiceActivityDetector 可以检测音频

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值