
声学特征总结
文章平均质量分 92
风雪夜回
让每一件事变得有意义!
展开
-
声事件识别之时域短时过零率
一、概念介绍短时过零率可以看做信号频率的简单度量,是谱特性的一种粗略估计。(1)过零就是指信号通过零值。过零率就是指每秒内信号值通过零值的次数(2)对于离散时间序列,过零则是指信号取样值改变符号,过零率则是每个样本改变符号的次数。对于声音信号,则是指一帧声音中语声音信号波形穿过横轴的次数,可以用相邻两个取样值改变符号的次数来计算。二、...原创 2018-06-27 09:34:00 · 3421 阅读 · 0 评论 -
声事件识别之mfcc特征提取的研究
一、基本介绍MFCC(Mel-Frequency Cepstral Coefficients)包含两步:第一将频率转化为梅尔频率;第二进行倒谱分析。它是基于人耳听觉特性提出来的,它与Hz频率成非线性对应关系,充分考虑了人耳对声音的听觉感知特性,目前主流的声事件分类方法之一,论文中常用其做对比算法。二、主要应用该特征主要应用于语音特征提取和降低运算维度(例如将1帧512维...原创 2018-06-27 09:48:24 · 3663 阅读 · 12 评论 -
声事件识别之谱质心特征研究
一、 特征参数介绍谱质心(Spectral Centroid)是描述音色属性的重要物理参数之一,是频率成分的重心,是在一定频率范围内通过能量加权平均的频率,其单位是Hz。它是声音信号的频率分布和能量分布的重要信息。在主观感知领域,谱质心描述了声音的明亮度,具有阴暗、低沉品质的声音倾向有较多低频内容,谱质心相对较低,具有明亮、欢快品质的多数集中在高频,谱质心相对较高。该参数常用于对乐...原创 2018-06-27 09:53:08 · 11204 阅读 · 9 评论 -
汽车鸣笛声、雨声和警笛声的频谱分析
声音频谱分析实验内容 本次实验将通过matlab绘制各种声音的频谱图去推算其频谱范围。其各种声音来源于ESC-50声音集,其采样频率为44.1KHz,采样位数为16位,时长,音频格式为WAV。种声音的频谱分析 汽车鸣笛声 对声音库中的两段...原创 2018-11-22 09:28:30 · 9939 阅读 · 0 评论 -
声音采样率对声音事件分类的简单探究
环境音识别简述 通过阅读国内外文献总结出声音识别的流程如下图所示。 图1.1 声音识别流程图 从上图可知,环境音识别主要由三部分组成:声音预处理、声音特征提取以及分类器分类。这三个部分将在后面做...原创 2018-11-22 09:44:06 · 4879 阅读 · 8 评论 -
短时主频点特征对声音表达能力探究1
摘要 本次实验我选取了玻璃破碎声、汽车鸣笛声和汽车引擎声三类声音,分别选取时域特征:短时能量、短时过零率,频域特征:短时主频点和mfcc特征,来对每类声音进行分析,并分析其表达能力实验数据说明 实验数据从哈佛大学用于环境声分类的ESC-50数据集中选取纯净的玻璃破碎声、鸣笛声和汽车引擎声各10条,其中每条数据时长5秒,采样率为44.1KHz,位深度16bit。频谱特征提取...原创 2018-11-22 10:50:58 · 979 阅读 · 4 评论 -
常见声音的时频统计特征的Python编程实现
摘要常规的声音识别方案中最关键的两个环节:特征构建和分类模型选择。这次我们学习传统的声音信号的时频域统计特征及其Python代码实现。特征描述及Python代码编程环境:Python3.6/3.5、 librosa 0.7一、Spectral centroid and spectral spreadIn digital signal processing, the spectral ...原创 2019-07-15 12:28:08 · 2728 阅读 · 0 评论