【从零开始】省时省力的哈希表

斯塔克家的真维斯

已于 2022-04-09 17:24:20 修改

阅读量1.1k

点赞数 1

分类专栏：从零开始的刷题学习文章标签： c++ 力扣哈希表

于 2022-04-09 17:10:39 首次发布

本文链接：https://blog.youkuaiyun.com/weixin_46276402/article/details/124064018

版权

从零开始的刷题学习专栏收录该内容

15 篇文章

订阅专栏

本文介绍了哈希表在解决编程问题时的高效性，如在滑动窗口、数组交集、快乐数及字符串相关问题中的应用。通过使用unordered_map、unordered_set和unordered_multiset，可以显著降低时间复杂度，实现快速查找和统计。同时，文章举例说明了如何利用哈希表判断两个数组的交集、有效字母异位词和赎金信问题。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

前面的滑动窗口部分我们使用过unordered_map，这是一种非常好用的键值对数据结构。

【从零开始】滑动窗口怎么滑

其实有很多题目，使用暴力遍历去求解会提高复杂度，而使用哈希表则会大幅降低复杂度。

set和map

set和map和unordered_set/unordered_map都是c++STL中常用的数据结构。

set和map底层为红黑树，会自动排序。而unordered版本底层为哈希表，不会自动排序。

multiset的值可以重复，而set则不可以（包括unordered）

mulitmap的key可以重复，而map不可以（包括unordered）

两个数组的交集

输出不重复

[leetcode 349 两个数组的交集](349. 两个数组的交集 - 力扣（LeetCode） (leetcode-cn.com))

给两个数组，比如：输入：nums1 = [1,2,2,1], nums2 = [2,2]

返回两个数组的交集，但是重复元素只输出一个。

比如上例中就只输出[2]

我们这里想把数组中的元素统计到一个地方，不允许重复，并且也不需要排序。

所以可以想到使用unordered_set最为方便。

比如num1=[1,2,2,1]，经过unordered_set就变为了[1,2]

统计完一个数组，只需要在遍历另一个数组时作比较，如果有相同则存入答案。

vector<int> intersection(vector<int>& nums1, vector<int>& nums2) {
        unordered_set<int>nums_set(nums1.begin(),nums1.end());//将nums1的数值存入unordered_set
        unordered_set<int>res;//结果集

        for(int num:nums2){
            if(nums_set.count(num)){//如果unordered_set里面有num2的数值
                res.insert(num);//加入结果集
            }
        }
        return vector<int>(res.begin(),res.end());//最后需要返回vector

    }

当然我们的结果集也需要是一个unordered_set，因为如果是vector的话还会出现重复的值。

输出重复

leetcode 350 两个数组的交集2

这是上一题的升级版，因为输出可以重复。

比如：输入：nums1 = [1,2,2,1], nums2 = [2,2]

输出为[2,2]

可能我们会有这样几种猜想：

如果用unordered_set存nums1，用vector存结果，是不是就可以了呢？

从这个例子来看的话，结果确实是对的。但这仅限于两个数组交集数量相等时，比如[4,9,5]和[9,4,9,8,4]，如果遇到一个存放到vector一次，结果就会变成[9,4,9,4]，明显不对。
既然允许重复，那我用两个unordered_multiset是不是可以呢？

同样对于上面的例子来说，multi允许重复，输出结果也是重复的。

核心思路为：记录nums1中数值的数量，然后nums2比较的过程中抵消。比如nums1中只有[4,9]，nums2中在遇到[4,9]时就会让计数减少，这样再碰到另一对[4,9]时就不会记录了。

所以最合适的数据结构是unordered_map。记录key和对应的数量。

vector<int> intersect(vector<int>& nums1, vector<int>& nums2) {
        unordered_map<int,int>nums_map;
        vector<int>res;
        for(int m:nums1){
            nums_map[m]++;
        }

        for(int num:nums2){
            if(nums_map.count(num)&&nums_map[num]!=0){//最重要的条件
                nums_set[num]--;
                res.push_back(num);
            }
        }
        return res;

    }

逻辑和上题类似，主要是判断条件，要加一个不等于0，否则即使对应的数量为0还会继续记录到vector。

快乐数

这是一道有些数学性质的题目

leetcode 202 快乐数

快乐数，就是把一个数根据每一位拆成几个数，在求这些数的平方和，一直重复这个过程。如果变为1则是快乐数。

对于这样重复计算，除了到1还会如何呢？有一个数学证明。

我们简略这个过程（求极限）得到结果，只会有两种情况：得到1或者一直循环

比如116。平方和1+1+36=38，接下来是73，58，89，145，42，20，4，16，37，又回到了58，进入循环。

所以我们的方法也分为两步：

计算平方和
在集合中寻找有没有这个数曾出现过，有就不用继续算了。

这里不重复的结果集我们用unordered_set

计算函数：

int getSum(int n){
        int sum=0;
        while(n){
            sum+=(n%10)*(n%10);
            n/=10;
        }
        return sum;
    }

这里的技巧是我们常用的分解数字的技巧。n%10是个位，n/10是除去个位前面的位。

判断是否为快乐数：

bool isHappy(int n) {
        unordered_set<int> nums;
        while(1){
            int sum=getSum(n);
            if(sum==1)//是1就返回
                return true;
            if(!nums.count(sum)){//看看集合有没有，没有就加入
                nums.insert(sum);
            }
            else//已经出现就跳出循环
                return false;
            n=sum;//求出的值是新的n
        }

    }

首先明确是一个while(1)一直进行的循环，只有在遇到1或者求出相同的数时才退出。

为什么要用unordered_set而不是数组之类的？

因为我们检查是否存在时，其他数据结构的时间复杂度是O(n)，而哈希的时间复杂度是O(1)

字符串有关的哈希

再说两个和字符串有关系的使用哈希表的题目。

其实对于这些数据结构，比如字符串，数组等等，他们有时候使用的方法是一致的，比如双指针，滑动窗口。

可以纵向总结也可以横向总结。

有效的字母异位词

前面我们在滑动窗口就遇到了异位词这个概念。其实就是一个字符串的排列。

leetcode 242 有效的字母异位词

给定一个字符串s，判断另一个字符串t是不是它的字母异位词。

比如s=“rat”,t=“tar”，那就是异位词。

我们用一个集合就可以搞定，不需要滑动窗口那么复杂。

为什么呢？因为要比较的子串大小是固定的，都是一样长的，不需要滑动来控制大小。

用一个集合把字母对应的个数存入，再遍历另一个子串时减少相应的个数。如果最后都为0则说明是异位词。

bool isAnagram(string s, string t) {
        int record[26]={0};

        for(int i=0;i<s.size();i++){
            record[s[i]-'a']++;
        }

        for(int j=0;j<t.size();j++){
            record[t[j]-'a']--;
        }

        for(int i=0;i<26;i++){
            if(record[i]!=0)
                return false;
        }
        return true;

    }

这里直接用一个数组来代替map，数组的下标可以对应ASCII码，这样就省去了map<char,int>的操作。

赎金信

leetcode 383 赎金信

简单来说就是两个字符串a和b，判断a能不能由b里面的字符构成，每个字符只能使用一次

比如a=“aa”，b="aab"就可以，而a=“aa”，b="ab"就不可以

逻辑和上面的题有一点点区别，上题要求的是完全吻合，而这道题只要够就可以了。

**也就是b中的字符>=a就可以了。**所以相减完只要大于等于0即返回true。

这次我们用新特性来写：

bool canConstruct(string ransomNote, string magazine) {
        int record[26]={0};

        for(char str1:magazine){
            record[str1-'a']++;
        }

        for(char str2:ransomNote){
            record[str2-'a']--;
        }

        for(int num:record){
            if(num<0)
                return false;
        }

        return true;

    }