RMQ (Range Minimum/Maximum Query)算法

高效解决区间最值查询问题的ST算法

最新推荐文章于 2025-12-02 20:14:43 发布

最新推荐文章于 2025-12-02 20:14:43 发布 · 74 阅读

文章标签：

#数据结构与算法

本文介绍了一种解决区间最值查询问题的高效算法——ST算法，通过在线处理方式，实现预处理阶段O(nlogn)复杂度，查询阶段O(1)复杂度，特别适用于数据量大、查询频繁的场景。

1、概述

RMQ（Range Minimum/Maximum Query），即区间最值查询，是指这样一个问题：对于长度为n的数列A，回答若干询问RMQ（A,i,j）(i,j<=n)，返回数列A中下标在i，j之间的最小/大值。这两个问题是在实际应用中经常遇到的问题，本文介绍了当前解决这两种问题的比较高效的算法。

2、 RMQ算法

对于该问题，最容易想到的解决方案是遍历，复杂度是O(n)。但当数据量非常大且查询很频繁时，该算法也许会存在问题。

本节介绍了一种比较高效的在线算法（ST算法）解决这个问题。所谓在线算法，是指用户每输入一个查询便马上处理一个查询。该算法一般用较长的时间做预处理，待信息充足以后便可以用较少的时间回答每个查询。ST（Sparse Table）算法是一个非常有名的在线处理RMQ问题的算法，它可以在O(nlogn)时间内进行预处理，然后在O(1)时间内回答每个查询。

首先是预处理，用动态规划（DP）解决。设A[i]是要求区间最值的数列，F[i, j]表示从第i个数起连续2^j个数中的最大值。例如数列3 2 4 5 6 8 1 2 9 7，F[1，0]表示第1个数起，长度为2^0=1的最大值，其实就是3这个数。 F[1，2]=5，F[1，3]=8，F[2，0]=2，F[2，1]=4……从这里可以看出F[i,0]其实就等于A[i]。这样，DP的状态、初值都已经有了，剩下的就是状态转移方程。我们把F[i，j]平均分成两段（因为f[i，j]一定是偶数个数字），从i到i+2^(j-1)-1为一段，i+2^(j-1)到i+2^j-1为一段(长度都为2^（j-1）)。用上例说明，当i=1，j=3时就是3,2,4,5 和 6,8,1,2这两段。F[i，j]就是这两段的最大值中的最大值。于是我们得到了动态规划方程F[i, j]=max（F[i，j-1], F[i + 2^(j-1)，j-1]）。

然后是查询。取k=[log2(j-i+1)]，则有：RMQ(A, i, j)=max{F[i,k],F[j-2^k+1,k]}。举例说明，要求区间[2，8]的最大值，就要把它分成[2,5]和[5,8]两个区间，因为这两个区间的最大值我们可以直接由f[2，2]和f[5，2]得到。

算法伪代码如下：

//初始化 INIT_RMQ //max[i][j]中存的是重j开始的2^i个数据中的最大值，最小值类似，num中存有数组的值 for i : 1 to n max[0][i] = num[i] for i : 1 to log(n)/log(2) for j : 1 to (n+1-2^i) max[i][j] = MAX(max[i-1][j], max[i-1][j+2^(i-1)] //查询 RMQ(i, j) k = log(j-i+1) / log(2) return MAX(max[k][i], max[k][j-2^k+1])
当然，该问题也可以用线段树（也叫区间树）解决，算法复杂度为：O(N)~O(logN)

例题：

代码如下：

#include<iostream> #include<cstdio> #include<string.h> #include<algorithm> #include<cmath> using namespace std; int FMAX[100010][20]; int FMIN[100010][20]; int main() { int N, Q, i, j, len, start, end; scanf("%d%d", &N, &Q); for(i = 1; i <= N; ++i) { scanf("%d", &FMAX[i][0]); FMIN[i][0] = FMAX[i][0]; } for(i = 1; i != 20; ++i) { for(j = 1; j <= N; ++j) if(j + (1<<i) - 1 <= N) { FMAX[j][i] = max(FMAX[j][i - 1], FMAX[j + (1<<(i - 1))][i - 1]); FMIN[j][i] = min(FMIN[j][i - 1], FMIN[j + (1<<(i - 1))][i - 1]); } } while(Q--) { scanf("%d%d", &start, &end); len = (int)(log(end - start + 1.0) / log(2.0)); printf("%d\n",max(FMAX[start][len], FMAX[end - (1<<len) + 1][len]) - min(FMIN[start][len], FMIN[end - (1<<len) + 1][len])); } return 0; }