音频节奏检测（Onset Detection）

最新推荐文章于 2025-10-09 05:01:17 发布

原创

最新推荐文章于 2025-10-09 05:01:17 发布 · 3.1w 阅读

106 ·

CC 4.0 BY-SA版权

文章标签：

#音频 #频谱分析 #Onset #Peak #傅里叶变换

本文介绍了音频节奏检测的基本流程，包括原始音频频谱分析、数据预处理（差值和傅里叶变换）、节拍检测（峰值检测）。通过差分处理和傅里叶变换，结合时间序列分析，确定音频的节拍。以44100Hz采样率的音频为例，解释了如何计算窗口代表的时间，并进行了峰值检测，以0.5秒为区间计算均值。

1. 前言

最近市场上出现一些多个视频拼接而成MV，其原理是根据音频的节拍变换切换视频。
我在这里讲述下如何进行音频节拍检测。

2. 音频检测一般流程

这里写图片描述

3.

3.1 原始音频频谱

以1024为窗口（即每次读取1024个采样点）进行量化

        WaveDecoder decoder = new WaveDecoder( new FileInputStream( "samples/sample.wav" ) );
        ArrayList<Float> allSamples = new ArrayList<Float>( );
        float[] samples = new float[1024];

        while( decoder.readSamples( samples ) > 0 )
        {
            for( int i = 0; i < samples.length; i++ )
                allSamples.add( samples[i] );
        }

        samples = new float[allSamples.size()];
        for( int i = 0; i < samples.length; i++ )
            samples[i] = allSamples.get(i);

        Plot plot = new Plot( "Wave Plot", 512, 512 );
        plot.plot( samples, 44100 / 1000, Color.red );