稍有难度的贪心构造题

文章讨论了LeetCode上的一个困难级别问题,768.最多能完成排序的块II。问题涉及将可能含有重复元素的数组分割并排序,目标是找到最多能分成多少个有序块。文章提出了使用贪心策略,通过对比原数组和已排序数组的词频来确定分块,证明了贪心解的正确性,并提供了Java和TypeScript的解决方案,时间复杂度为O(nlogn),空间复杂度为O(n)。

题目描述

这是 LeetCode 上的 768. 最多能完成排序的块 II ,难度为 困难

Tag : 「贪心」

这个问题和“最多能完成排序的块”相似,但给定数组中的元素可以重复,输入数组最大长度为 200020002000,其中的元素最大为 10810^8108。

arr 是一个可能包含重复元素的整数数组,我们将这个数组分割成几个“块”,并将这些块分别进行排序。之后再连接起来,使得连接的结果和按升序排序后的原数组相同。

我们最多能将数组分成多少块?

示例 1:

输入: arr = [5,4,3,2,1]

输出: 1

解释:
将数组分成2块或者更多块,都无法得到所需的结果。
例如,分成 [5, 4], [3, 2, 1] 的结果是 [4, 5, 1, 2, 3],这不是有序的数组。 
复制代码

示例 2:

输入: arr = [2,1,3,4,4]

输出: 4

解释:
我们可以把它分成两块,例如 [2, 1], [3, 4, 4]。
然而,分成 [2, 1], [3], [4], [4] 可以得到最多的块数。 
复制代码

注意:

  • arr 的长度在 [1,2000][1, 2000][1,2000] 之间。
  • arr[i] 的大小在 [0,108][0, 10^8][0,108] 之间。

贪心 + 构造

一种容易想到的构造方法,是与目标序列(已排升序的数组 clone)做区间比较。

由于题目要求尽可能划分出多的区间,我们可以从前往后处理 arrclone 时统计区间内数的情况,若有 arr[i...j]clone[i...j] 词频完全相同,可知 arr[i...j] 可通过内部排序调整为 clone[i...j],此时我们将范围 [i...j][i...j][i...j] 划分为一个区间,然后继续往后处理直到整个数组处理完。

容易证明该做法的正确性:可从边界开始进行归纳分析,起始两者均从下标为 000 的位置进行扫描。假设最优解和贪心解的第一个区间的结束位置相同,问题就会归结到子问题上(即双方均从相同的子数组起始位置开始构造),因此无须额外证明;而当起始位置相同,结束位置不同时,假设分别为 clone[i...j1]clone[i...j_1]clone[i...j1​] 和 arr[i...j2]arr[i...j_2]arr[i...j2​],则必然有 j1>j2j_1 > j_2j1​>j2​(因为如果有 j1<j2j_1 < j_2j1​<j2​,那么在 arrarrarr 扫描到 j1j_1j1​ 位置时已经满足划分区间的条件,已经会停下来,即与贪心决策逻辑冲突),而当 j1>j2j_1 > j_2j1​>j2​ 时,我们可以将最优解中的区间 clone[i...j1]clone[i...j_1]clone[i...j1​] 进一步划分为 clone[i...j2]clone[i...j_2]clone[i...j2​] 和 clone[j2+1...j1]clone[j_2+1 ... j_1]clone[j2​+1...j1​] 两段,同时不影响后续的构造过程,使得最终划分的区间数增大,即与最优解本身无法划分冲突。

根据数值之间满足严格全序,可知当 j1>j2j_1 > j_2j1​>j2​ 和 j1<j2j_1 < j_2j1​<j2​ 均不满足时,必然有 j1=j2j_1 = j_2j1​=j2​ 为真。

综上,我们证明了对于相同起点,贪心解与最优解结束位置必然相同,从而证明贪心解区间数与最优解相等。

于是原问题转换为如何快速对两数组(原数组 arr 和目标数组 clone)进行词频比较,由于数值的范围为 10810^8108,如果使用最裸的词频对比方案的话,需要先进行离散化,最终算法的复杂度为 O(nlog⁡n+n2)O(n\log{n} + n^2)O(nlogn+n2)。而更好的解决方案是使用哈希表进行计数,同时维护当前计数不为 000 的数值数量 tot,具体的,当我们处理 arr[i]arr[i]arr[i] 时,我们在哈希表中对 arr[i]arr[i]arr[i] 进行计数加一,而在处理 clone[i]clone[i]clone[i] 时,对 clone[i]clone[i]clone[i] 进行计数减一。从而将词频比较的复杂度从 O(n2)O(n^2)O(n2) 下降到 O(n)O(n)O(n)。

Java 代码:

class Solution {
    public int maxChunksToSorted(int[] arr) {
        int[] clone = arr.clone();
        Arrays.sort(clone);
        int n = arr.length, ans = 0;
        Map<Integer, Integer> map = new HashMap<>();
        for (int i = 0, tot = 0; i < n; i++) {
            int a = arr[i], b = clone[i];
            if (map.getOrDefault(a, 0) == -1) tot--;
            else if (map.getOrDefault(a, 0) == 0) tot++;
            map.put(a, map.getOrDefault(a, 0) + 1);
            if (map.getOrDefault(b, 0) == 1) tot--;
            else if (map.getOrDefault(b, 0) == 0) tot++;
            map.put(b, map.getOrDefault(b, 0) - 1);
            if (tot == 0) ans++;
        }
        return ans;
    }
}
复制代码

TypeScript 代码:

function maxChunksToSorted(arr: number[]): number {
    let clone = [...arr].sort((a,b)=>a-b)
    let n = arr.length, ans = 0
    const map = new Map<number, number>()
    for (let i = 0, tot = 0; i < n; i++) {
        const a = arr[i], b = clone[i]
        if (!map.has(a)) map.set(a, 0)
        if (map.get(a) == 0) tot++
        else if (map.get(a) == -1) tot--;
        map.set(a, map.get(a) + 1)
        if (!map.has(b)) map.set(b, 0)
        if (map.get(b) == 0) tot++
        else if (map.get(b) == 1) tot--
        map.set(b, map.get(b) - 1)
        if (tot == 0) ans++
    }
    return ans
};
复制代码
  • 时间复杂度:O(nlog⁡n)O(n\log{n})O(nlogn)
  • 空间复杂度:O(n)O(n)O(n)

最后

这是我们「刷穿 LeetCode」系列文章的第 No.768 篇,系列开始于 2021/01/01,截止于起始日 LeetCode 上共有 1916 道题目,部分是有锁题,我们将先把所有不带锁的题目刷完。

在这个系列文章里面,除了讲解解题思路以外,还会尽可能给出最为简洁的代码。如果涉及通解还会相应的代码模板。

为了方便各位同学能够电脑上进行调试和提交代码,我建立了相关的仓库:github.com/SharingSour…

在仓库地址里,你可以看到系列文章的题解链接、系列文章的相应代码、LeetCode 原题链接和其他优选题解。

更多更全更热门的「笔试/面试」相关资料可访问排版精美的 合集新基地 🎉🎉

在Codeforces的2000-2500分区间,确实存在一些**思维难度不高但极易WA**的目。这些目往往因为以下特点而为"陷阱": ### 一、高频易错型分析 1. **贪心+特判类** - 典型特征:有直观解法但隐藏边界条件 - 例:CF1555D (2000分) - 陷阱:仅考虑"abc"循环而忽略其他可能更优的模式 - 避坑:预计算所有3字符排列组合(6种可能) 2. **数学/数论类** - 典型特征:结论简单但特判点多 - 例:CF1542B (变形后2000+) - 陷阱:忽略a=1或b=0的特殊情况 - 数据验证:n=1e9时检查运算溢出 3. **字符串构造类** - 典型特征:实现复杂度高 - 例:CF1481D (2000分) - 陷阱:未处理n=2的corner case - 调试技巧:先验证n≤3的小数据 ### 二、针对性训练方法 1. **边界条件训练**: - 对每个目强制构造: - 全同数据 - 极值数据(如n=1或max_n) - 随机但特殊结构数据 2. **WA诊断流程**: ```python if WA_on_test_2: 检查初始条件 elif WA_on_large_case: 检查算法复杂度 elif WA_on_hidden_case: 构造极端数据 else: 对拍验证 ``` 3. **防错编码习惯**: - 数学:立即处理a=0/1, b=0等特殊情况 - 贪心:先证明再编码 - 字符串:先写暴力验证器 ### 三、推荐练习目 | 目 | 分数 | 易错点 | 训练重点 | |------|------|--------|----------| | [CF1555D](https://codeforces.com/problemset/problem/1555/D) | 2000 | 循环节选择 | 小数据验证 | | [CF1593D2](https://codeforces.com/problemset/problem/1593/D2) | 2100 | 负数模数 | 数学特判 | | [CF1613C](https://codeforces.com/problemset/problem/1613/C) | 1800+ | 最后一击 | 边界处理 | | [CF1469C](https://codeforces.com/problemset/problem/1469/C) | 2100 | 高度差计算 | 断言检查 | ### 四、实战技巧 1. **倒序检查法**: - 先写特殊情况的处理代码 - 再写主算法逻辑 - 最后添加防御性断言 2. **对拍模板**: ```bash #!/bin/bash while true; do ./gen > input ./main < input > output ./brute < input > answer diff output answer || break done ``` 3. **WA后检查清单**: - 是否处理了最小/最大输入? - 是否有中间结果溢出? - 贪心策略是否有反例? - 循环边界是否正确?
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值