学习笔记----RMQ算法

本文介绍了解决RMQ(区间最值查询)问题的一种高效算法——ST算法。通过预处理实现O(nlogn)的时间复杂度,并能在O(1)时间内回答每个查询。详细解释了动态规划的应用及查询过程。
1. 概述

RMQ(Range Minimum/Maximum Query),即区间最值查询,是指这样一个问题:对于长度为n的数列A,回答若干询问RMQ(A,i,j)(i,j<=n),返回数列A中下标在i,j之间的最小/大值。这两个问题是在实际应用中经常遇到的问题,下面介绍一下解决这两种问题的比较高效的算法。当然,该问题也可以用线段树(也叫区间树)解决,算法复杂度为:O(N)~O(logN),这里我们暂不介绍。


2.RMQ算法

对于该问题,最容易想到的解决方案是遍历,复杂度是O(n)。但当数据量非常大且查询很频繁时,该算法无法在有效的时间内查询出正解。

本节介绍了一种比较高效的在线算法(ST算法)解决这个问题。所谓在线算法,是指用户每输入一个查询便马上处理一个查询。该算法一般用较长的时间做预处理,待信息充足以后便可以用较少的时间回答每个查询。ST(Sparse Table)算法是一个非常有名的在线处理RMQ问题的算法,它可以在O(nlogn)时间内进行预处理,然后在O(1)时间内回答每个查询。


(一)首先是预处理,用动态规划(DP)解决。

设A[i]是要求区间最值的数列,F[i, j]表示从第i个数起连续2^j个数中的最大值。(DP的状态)

例如:

A数列为:3 2 4 5 6 8 1 2 9 7

F[1,0]表示第1个数起,长度为2^0=1的最大值,其实就是3这个数。同理 F[1,1] = max(3,2) = 3, F[1,2]=max(3,2,4,5) = 5,F[1,3] = max(3,2,4,5,6,8,1,2) = 8;

并且我们可以容易的看出F[i,0]就等于A[i]。(DP的初始值)

这样,DP的状态、初值都已经有了,剩下的就是状态转移方程。

我们把F[i,j]平均分成两段(因为f[i,j]一定是偶数个数字),从 i 到i + 2 ^ (j - 1) - 1为一段,i + 2 ^ (j - 1)到i + 2 ^ j - 1为一段(长度都为2 ^ (j - 1))。用上例说明,当i=1,j=3时就是3,2,4,5 和 6,8,1,2这两段。F[i,j]就是这两段各自最大值中的最大值。于是我们得到了状态转移方程F[i, j]=max(F[i,j-1], F[i + 2^(j-1),j-1])。

代码如下:

void RMQ(int num) //预处理->O(nlogn)
{
	for(int j = 1; j < 20; ++j)
		for(int i = 1; i <= num; ++i)
			if(i + (1 << j) - 1 <= num)
			{
				maxsum[i][j] = max(maxsum[i][j - 1], maxsum[i + (1 << (j - 1))][j - 1]);
				minsum[i][j] = min(minsum[i][j - 1], minsum[i + (1 << (j - 1))][j - 1]);
			}
}

这里我们需要注意的是循环的顺序,我们发现外层是j,内层所i,这是为什么呢?可以是i在外,j在内吗?


答案是不可以。因为我们需要理解这个状态转移方程的意义。

状态转移方程的含义是:先更新所有长度为F[i,0]即1个元素,然后通过2个1个元素的最值,获得所有长度为F[i,1]即2个元素的最值,然后再通过2个2个元素的最值,获得所有长度为F[i,2]即4个元素的最值,以此类推更新所有长度的最值。

而如果是i在外,j在内的话,我们更新的顺序就是F[1,0],F[1,1],F[1,2],F[1,3],表示更新从1开始1个元素,2个元素,4个元素,8个元素(A[0],A[1],....A[7])的最值,这里F[1,3] = max(max(A[0],A[1],A[2],A[3]),max(A[4],A[5],A[6],A[7]))的值,但是我们根本没有计算max(A[0],A[1],A[2],A[3])和max(A[4],A[5],A[6],A[7]),所以这样的方法肯定是错误的。


为了避免这样的错误,一定要好好理解这个状态转移方程所代表的含义。



(二)然后是查询。

假如我们需要查询的区间为(i,j),那么我们需要找到覆盖这个闭区间(左边界取i,右边界取j)的最小幂(可以重复,比如查询5,6,7,8,9,我们可以查询5678和6789)。

因为这个区间的长度为j - i + 1,所以我们可以取k=log2( j - i + 1),则有:RMQ(A, i, j)=max{F[i , k], F[ j - 2 ^ k + 1, k]}。

举例说明,要求区间[2,8]的最大值,k = log2(8 - 2 + 1)= 2,即求max(F[2, 2],F[8 - 2 ^ 2 + 1, 2]) = max(F[2, 2],F[5, 2]);


在这里我们也需要注意一个地方,就是<<运算符和+-运算符的优先级。

比如这个表达式:5 - 1 << 2是多少?


答案是:4 * 2 * 2 = 16。所以我们要写成5 - (1 << 2)才是5-1 * 2 * 2 = 1。

查询的代码是:

 while(1<<(k+1) <= r-l+1)
                k++;
            Max = max(Dp_Max[l][k], Dp_Max[r-(1<<k)+1][k]);
            Min = min(Dp_Min[l][k], Dp_Min[r-(1<<k)+1][k]);



当前问题涉及 `zip` 命令的 `-rmq` 参数用法,然而根据已知的标准文档和常见实践,`zip` 命令并没有名为 `-rmq` 的参数组合。以下是关于此问题的具体分析: --- ### 已知信息 1. **Zip命令基础** `zip` 是一种常用的压缩工具,在 Unix 和 Linux 系统中广泛使用。其基本语法如下: ```bash zip [选项] 压缩包名 文件或目录列表 ``` 2. **常用参数说明** - `-r`: 表示递归处理,将指定目录下的所有子目录和文件都包含在压缩包中。 - `-m`: 表示在压缩完成后删除原始文件。 - `-q`: 表示静默模式,不显示任何提示信息。 3. **未定义的参数** 经过查阅标准手册以及实际测试,`zip` 并不存在单独的 `-rmq` 参数组合。通常情况下,多个短选项可以连写在一起,例如 `-rmq` 可能被理解为 `-r`, `-m`, 和 `-q` 同时生效。但如果存在拼写错误或其他误解,则可能导致功能异常。 4. **关联上下文** 提供的引用内容主要围绕 RocketMQ 的消费者与生产者配置[^1][^2],以及性能优化建议[^3],并未提及有关 `zip` 或其参数的内容。因此推测该问题是独立提出的。 --- ### 正确用法示例 #### 示例 1: 使用 `-r` 参数递归压缩整个目录 ```bash zip -r archive_name.zip target_directory/ ``` 上述命令会将目标目录及其内部所有文件打包成一个 ZIP 归档文件。 #### 示例 2: 结合 `-m` 删除原文件并保持安静操作 ```bash zip -rmq final_archive.zip file1.txt folder1/ folder2/ ``` 这条指令实现了以下行为: - 将 `file1.txt`、`folder1/` 和 `folder2/` 添加至最终的 ZIP 文件; - 完成后自动移除这些源对象 (`-m`); - 整个过程无多余日志输出 (`-q`)。 注意:务必确认不需要保留原始数据后再启用 `-m`! --- ### 性能注意事项 虽然本主题聚焦于 `zip` 而非消息队列框架如 RocketMQ,但仍可借鉴部分原理来提高效率。例如当批量处理大量小型文件时,磁盘 I/O 成为主要瓶颈之一。此时可以通过调整操作系统级 IO 调度策略(如同 commitlog 随机读场景下推荐 Deadline 算法那样[^3]),或者预先整理待压缩素材减少碎片化程度等方式加速整体流程。 --- ###
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值