环境声音分析中的声学特征:方法与应用
1. 特征学习技术
在过去几年里,特征学习技术在声音场景和事件分析应用中越来越受欢迎。这些技术主要是为了解决手工特征的一些普遍局限性,并且已被证明是可行的替代方案。
1.1 非负矩阵分解(NMF)
NMF在多个场合都显示出比大多数基于特征工程的方法能提供更好的表示。例如,在声音场景和事件分类问题上,NMF可以通过将在单个声音上学习到的字典作为特征,或者将在代表整个训练数据的公共字典上的投影作为特征,来提高性能。使用稀疏和卷积变体的NMF还能进一步提升效果。
1.2 概率潜在分量分析
这是NMF的概率等价形式,主要应用于其时间约束的平移不变版本。
1.3 其他无监督特征学习方法
还包括球形K - 均值、词袋特征等方法,用于声音场景和事件的分类。
1.4 监督特征学习
在声音场景和事件分析中,还引入了一些特征学习技术的监督变体。对于分类问题,监督特征学习主要是在特征学习阶段纳入关于类标签的先验知识,以学习更具判别性的数据表示。例如,在声学事件检测中,一些工作在使用NMF或卷积NMF分解之前将标签序列纳入数据;在声音场景分类中,通过联合优化问题学习非负字典和分类器,或者约束每个字典元素仅代表一个声音标签。
2. 降维和特征选择
在设计声音场景或事件分类系统时,可以考虑大量潜在有用的特征。但使用所有这些特征进行分类可能不是最优的,因为许多特征可能是冗余的,甚至由于提取过程不稳健而带有噪声。因此,特征选择或压缩(通过变换)变得不可避免,目的是降低问题的复杂度(通过降低维度),
超级会员免费看
订阅专栏 解锁全文
2037

被折叠的 条评论
为什么被折叠?



