复杂声音场景分析方法
1 引言
在声音场景分析中,检测和分类声音事件是一项重要任务。声音事件可能是单声道的(同一时间只有一个事件活跃),也可能是多声道的(多个事件同时活跃)。本文将介绍单声道和多声道声音事件检测与分类的相关方法。
2 单声道事件检测与分类
2.1 单声道事件检测概述
单声道事件检测假设同一时间只有一个事件活跃,虽然在一般声音场景中这一假设不太现实,但在某些稀疏声音场景中大部分时间是成立的,也可用于检测声音场景中的主要事件。
2.2 简单检测方法
- 能量阈值法 :对于每个音频帧,如果其能量(或功率、幅度)高于阈值,则认为事件活跃。该方法简单高效,常用于资源受限的探测器,如手机语音活动检测或生物声学远程监测。可通过自适应阈值或比较信号不同子带的能量来改进。
- 事件起始点检测 :许多事件类型(如打击乐声音事件)的起始点表现为能量的突然增加。此方法常用于音乐信号处理,用于节奏分析和自动转录。研究人员已开发出适用于多种声音类型的通用起始点检测器,打击乐起始点通常最容易检测。
- 模板匹配 :当感兴趣的事件具有高度刻板的时间和频率特征时,模板匹配是一种简单而稳健的检测方法。通常从频谱图中取一个时频“补丁”作为模板,然后测量模板与待分析信号频谱图之间的互相关,互相关函数中的强峰值对应事件检测结果。
2.3 基于机器学习的分类方法
为开发更具选择性的事件检测器,可使用基于机器学习的自动分
超级会员免费看
订阅专栏 解锁全文
4903

被折叠的 条评论
为什么被折叠?



