python: audioFlux XXCC 提取梅尔频率倒谱系数 MFCC

承上一篇:python:audioFlux 使用教程

XXCC: 倒谱系数,支持所有频谱类型. 可以提取梅尔频率倒谱系数(MFCC)
    Cepstrum coefficients, supports all spectrum types.

以下是使用 audioflux 库中 XXCC 类计算倒谱系数(如 MFCC)的示例代码

代码说明:

  1. 音频读取:使用 af.utils.sample_path('220') 获取一个 220Hz 的音频文件路径,然后使用 af.read 函数读取音频数据和采样率。
  2. 频谱图提取:创建 BFT 对象,设置参数并调用 bft 方法提取 mel 频谱图,最后取绝对值得到幅度谱。
  3. MFCC 提取:创建 XXCC 对象,设置时间长度,然后调用 xxcc 方法提取 MFCC 特征。
  4. 可视化:使用 fill_spec 函数将 MFCC 特征可视化,并添加颜色条。

编写示例 audio_xxcc.py  如下

# -*- coding: utf-8 -*-
""" XXCC: 倒谱系数,支持所有频谱类型. 提取梅尔频率倒谱系数(MFCC)
    Cepstrum coefficients, supports all spectrum types.
"""
import audioflux as af
import numpy as np
import matplotlib.pyplot as plt
from audioflux.type import SpectralFilterBankScaleType, SpectralDataType, CepstralRectifyType
from audioflux.display import fill_spec

# 获取一个 220Hz 的音频文件
sample_path = af.utils.sample_path('220')
print(sample_path)
# 读取音频文件
audio_arr, sr = af.read(sample_path)

# 创建 BFT 对象并提取 mel 梅尔频谱
num = 128
bft_obj = af.BFT(
    num=num,
    radix2_exp=12,
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值