音频节奏检测(Onset Detection)

本文介绍了音频节奏检测的基本流程,包括原始音频频谱分析、数据预处理(差值和傅里叶变换)、节拍检测(峰值检测)。通过差分处理和傅里叶变换,结合时间序列分析,确定音频的节拍。以44100Hz采样率的音频为例,解释了如何计算窗口代表的时间,并进行了峰值检测,以0.5秒为区间计算均值。

1. 前言

最近市场上出现一些多个视频拼接而成MV,其原理是根据音频的节拍变换切换视频。
我在这里讲述下如何进行音频节拍检测。


2. 音频检测一般流程

这里写图片描述

3.

3.1 原始音频频谱

以1024为窗口(即每次读取1024个采样点)进行量化

        WaveDecoder decoder = new WaveDecoder( new FileInputStream( "samples/sample.wav" ) );
        ArrayList<Float> allSamples = new ArrayList<Float>( );
        float[] samples = new float[1024];

        while( decoder.readSamples( samples ) > 0 )
        {
            for( int i = 0; i < samples.length; i++ )
                allSamples.add( samples[i] );
        }

        samples = new float[allSamples.size()];
        for( int i = 0; i < samples.length; i++ )
            samples[i] = allSamples.get(i);

        Plot plot = new Plot( "Wave Plot", 512, 512 );
        plot.plot( samples, 44100 / 1000, Color.red );

音频频谱如下:
这里写图片描述

3.2 数据预处理

(1)差值处理
差值处理是分析序列数据的基本本方法。
我们把当前窗口数据减去上一个窗口数据,得到差值数据,公式如下:
SF(k)=

评论 12
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值