MFCC程序参数详解

该文章详细解析了使用MATLAB进行MFCC参数提取的函数`mfcc_m`,涉及预加重、分帧、汉明窗、梅尔滤波器、离散余弦变换(DCT)、倒谱系数及差分计算等步骤。代码源自宋知用老师的著作,旨在帮助理解MFCC算法的实现过程。

本文程序来源于宋知用老师编著的《MATLAB在语音信号分析与合成中的应用》

function ccc=mfcc_m(x,fs,p,frameSize,inc)
% % % % % % % % % % % % % % % % % % % % % % % % % % % %
% function ccc=mfcc_m(x);
%对输入的语音序列x进行MFCC参数的提取,返回MFCC参数和一阶
%差分MFCC参数,Mel滤波器的个数为p,采样频率为fs
%对x每frameSize点分为一帧,相邻两帧之间的帧移为inc
% FFT的长度为帧长
% % % % % % % % % % % % % % % % % % % % % % % % % % % %

% 按帧长为frameSize,Mel滤波器的个数为p,采样频率为fs
% 提取Mel滤波器参数,用汉明窗函数
bank=melbankm(p,frameSize,fs,0,0.5,’m’);
% 归一化Mel滤波器组系数
bank=full(bank);
bank=bank/max(bank(:));
%——————————————————————————————————-
%MATLAB中对稀疏矩阵的存储有两种方法:一是八所有的元素都存储;另一种是只储存非0元素。函数full将稀疏矩阵转化为全矩阵,把矩阵中所有的元素都存储,方便以后运算。
%输出参数bank是滤波器的频率响应,是一个p *(n/2+1)维的矩阵
%——————————————————————————————————-

% DCT系数,12*p
for k=1:12
n=0:p-1;
dctcoef(k,:)=cos((2*n+1)*k*pi/(2*p));
end
%——————————————————————————————————-
%这里的循环次数12是选的MFCC参数的个数,通常取12个,一般在12~16个之间
%dctcoef是一个12*p维的矩阵
%—

数据集介绍:电力线目标检测数据集 一、基础信息 数据集名称:电力线目标检测数据集 图片数量: 训练集:2898张图片 验证集:263张图片 测试集:138张图片 总计:3299张图片 分类类别: 类别ID: 0(电力线) 标注格式: YOLO格式,包含对象标注信息,适用于目标检测任务。 数据格式:JPEG/PNG图片,来源于空中拍摄或监控视觉。 二、适用场景 电力设施监控与巡检: 数据集支持目标检测任务,帮助构建能够自动识别和定位电力线的AI模型,用于无人机或固定摄像头巡检,提升电力设施维护效率和安全性。 能源与公用事业管理: 集成至能源管理系统中,提供实时电力线检测功能,辅助进行风险 assessment 和预防性维护,优化能源分配。 计算机视觉算法研究: 支持目标检测技术在特定领域的应用研究,促进AI在能源和公用事业行业的创新与发展。 专业培训与教育: 数据集可用于电力行业培训课程,作为工程师和技术人员学习电力线检测与识别的重要资源。 三、数据集优势 标注精准可靠: 每张图片均经过专业标注,确保电力线对象的定位准确,适用于高精度模型训练。 数据多样性丰富: 包含多种环境下的电力线图片,如空中视角,覆盖不同场景条件,提升模型的泛化能力和鲁棒性。 任务适配性强: 标注格式兼容YOLO等主流深度学习框架,便于快速集成和模型开发,支持目标检测任务的直接应用。 实用价值突出: 专注于电力线检测,为智能电网、自动化巡检和能源设施监控提供关键数据支撑,具有较高的行业应用价值。
评论 6
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值