根号平衡
1.算法分析
有时我们会碰到这样一类问题,长度为 n n n的序列, m m m个询问(通常 n n n和 m m m同阶),可能存在两种比较显然的方法,一种是预 O ( n ) O(n) O(n)处理 O ( 1 ) O(1) O(1)回答,一种是不预处理回 O ( n ) O(n) O(n)答* m m m*个询问,这两种方法都是 O ( n 2 ) O(n^2) O(n2)的。考虑是否存在一种策略能“平衡”一下预处理和询问的复杂度。
2.典型例题
CF1447F2 Frequency Problem (Hard Version)
题意: 给出一串数字,要求找到一个最长子区间,需要满足:这个子区间中出现最多次数的数字有不止一个。
例如:1 1 1 5 4 1 3 1 2 2
满足要求的最长区间为5 4 1 3 1 2 2,因为1和2都出现了2次
题解: 先来想朴素的算法,首先可以确定的是假设在整个数组中出现次数最多的数字为 m x mx mx,那么对于答案区间, m x mx mx必然也是出现次数最多的数之一。所以我们可以枚举另一个出现次数最多的数,另其为d,然后从前往后扫描整个数组,遇到d则使cur++,遇到 m x mx mx则使 c u r − − cur-- cur−−,用数组 l a s t [ c u r ] last[cur] last[cur] 记录cur第一次出现的位置,那么对于位置 i i i,得到一个 c u r cur cur值, i − l a s t [ c u r ] + 1 i-last[cur]+1 i−last[cur]+1则是满足 m x mx mx和 d d d出现次数相等的最长区间,那么怎么找到最终的答案呢,就需要枚举 d d d,这样复杂度是 O ( n 2 ) O(n^2) O(n2)
但是本题数据量大,不能采用 O ( n 2 ) O(n^2) O(n2)的算法,考虑根号平衡,读入时记录 a [ i ] a[i] a[i]在数组中出现的次数 c n t [ a [ i ] ] cnt[a[i]] cnt[a[i]]。然后处理时,只选取 c n t [ a [ i ] ] > = n cnt[a[i]]>=\sqrt{n} cnt[a[i]