最长连续序列-哈希

文章描述了一种在给定未排序整数数组中寻找最长连续序列的算法,通过使用哈希表优化查找操作,将时间复杂度降低到O(n),并通过实例和分析复杂度来解释解决方案。

给定一个未排序的整数数组 nums ,找出数字连续的最长序列(不要求序列元素在原数组中连续)的长度。

请你设计并实现时间复杂度为 O(n) 的算法解决此问题。

示例 1:

输入:nums = [100,4,200,1,3,2]
输出:4
解释:最长数字连续序列是 [1, 2, 3, 4]。它的长度为 4。
示例 2:

输入:nums = [0,3,7,2,5,8,4,6,0,1]
输出:9

提示:

0 <= nums.length <= 10510^5105
−109-10^9109 <= nums[i] <= 10910^9109

转:https://leetcode.cn/problems/longest-consecutive-sequence/solution/zui-chang-lian-xu-xu-lie-by-leetcode-solution/

我们考虑枚举数组中的每个数 x,考虑以其为起点,不断尝试匹配 x+1, x+2,⋯ 是否存在,假设最长匹配到了 x+y,那么以 x 为起点的最长连续序列即为 x, x+1, x+2,…x+y,其长度为 y+1,我们不断枚举并更新答案即可。

对于匹配的过程,暴力的方法是 O(n) 遍历数组去看是否存在这个数,但其实更高效的方法是用一个哈希表存储数组中的数,这样查看一个数是否存在即能优化至O(1) 的时间复杂度。

仅仅是这样我们的算法时间复杂度最坏情况下还是会达到 O(n^2)(即外层需要枚举 O(n)个数,内层需要暴力匹配 O(n) 次),无法满足题目的要求。但仔细分析这个过程,我们会发现其中执行了很多不必要的枚举,如果已知有一个 x, x+1, x+2⋯,x+y 的连续序列,而我们却重新从 x+1,x+2 或者是 x+y 处开始尝试匹配,那么得到的结果肯定不会优于枚举 x 为起点的答案,因此我们在外层循环的时候碰到这种情况跳过即可。

那么怎么判断是否跳过呢?由于我们要枚举的数 x 一定是在数组中不存在前驱数 x-1的,不然按照上面的分析我们会从 x-1 开始尝试匹配,因此我们每次在哈希表中检查是否存在 x-1 即能判断是否需要跳过了。

class Solution:
    def longestConsecutive(self, nums: list) -> int:
        longest_len = 0
        num_set = set(nums)

        for num in num_set:
            if num - 1 not in num_set:
                current_num = num
                current_len = 1

                while current_num + 1 in num_set:
                    current_num += 1
                    current_len += 1

                longest_len = max(longest_len, current_len)

        return longest_len

增加了判断跳过的逻辑之后,时间复杂度是多少呢?外层循环需要 O(n) 的时间复杂度,只有当一个数是连续序列的第一个数的情况下才会进入内层循环,然后在内层循环中匹配连续序列中的数,因此数组中的每个数只会进入内层循环一次。根据上述分析可知,总时间复杂度为 O(n),符合题目要求。

复杂度分析

  • 时间复杂度:O(n),其中 n 为数组的长度。具体分析已在上面正文中给出。

  • 空间复杂度:O(n))。哈希表存储数组中所有的数需要 O(n) 的空间。

### 使用哈希表实现最长连续序列算法 #### 方法概述 为了在 O(n) 时间复杂度内解决问题,可以采用基于哈希集合的方法来寻找最长的连续序列。该方法通过构建一个无序集合作为数据结构的一部分,从而允许快速查找是否存在某个特定数值。 对于每一个元素 num,在未访问过的条件下尝试向两个方向扩展——即向上探索 `num + 1` 和向下探索 `num - 1` 是否存在于当前建立起来的数据集中;如果存在,则继续沿此路径前进直到无法再延长为止,并在此过程中维护最大长度变量以记录迄今为止发现的最大连续子串大小[^1]。 #### 实现细节 具体来说,当遍历输入列表中的各个数字时: - 如果某数已被标记过则跳过它; - 否则初始化计数器并分别检查其相邻位置是否位于散列容器之内; - 更新全局最优解以及局部连贯片段尺寸直至完成整个迭代过程。 以下是 C++ 中的一个可能实现方式: ```cpp #include <unordered_set> #include <vector> using namespace std; int longestConsecutive(vector<int>& nums) { unordered_set<int> num_set(nums.begin(), nums.end()); int longestStreak = 0; for (const auto& num : num_set) { // Only start counting from the beginning of a sequence if (!num_set.count(num - 1)) { int currentNum = num; int currentStreak = 1; while (num_set.count(currentNum + 1)) { currentNum += 1; currentStreak += 1; } longestStreak = max(longestStreak, currentStreak); } } return longestStreak; } ``` 上述代码段展示了如何利用C++标准库提供的`std::unordered_set`类模板创建一个高效的查找机制,进而支持常量平均情况下插入/删除操作的时间性能需求。此外还体现了只针对那些可能是潜在起点(也就是不存在前驱节点的情况)执行进一步探测逻辑的设计考量。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值