前面的滑动窗口部分我们使用过unordered_map,这是一种非常好用的键值对数据结构。
其实有很多题目,使用暴力遍历去求解会提高复杂度,而使用哈希表则会大幅降低复杂度。
set和map
set和map和unordered_set/unordered_map都是c++STL中常用的数据结构。
set和map底层为红黑树,会自动排序。而unordered版本底层为哈希表,不会自动排序。
multiset的值可以重复,而set则不可以(包括unordered)
mulitmap的key可以重复,而map不可以(包括unordered)
两个数组的交集
输出不重复
[leetcode 349 两个数组的交集](349. 两个数组的交集 - 力扣(LeetCode) (leetcode-cn.com))
给两个数组,比如:输入:nums1 = [1,2,2,1], nums2 = [2,2]
返回两个数组的交集,但是重复元素只输出一个。
比如上例中就只输出[2]
我们这里想把数组中的元素统计到一个地方,不允许重复,并且也不需要排序。
所以可以想到使用unordered_set最为方便。
比如num1=[1,2,2,1],经过unordered_set就变为了[1,2]
统计完一个数组,只需要在遍历另一个数组时作比较,如果有相同则存入答案。
vector<int> intersection(vector<int>& nums1, vector<int>& nums2) {
unordered_set<int>nums_set(nums1.begin(),nums1.end());//将nums1的数值存入unordered_set
unordered_set<int>res;//结果集
for(int num:nums2){
if(nums_set.count(num)){//如果unordered_set里面有num2的数值
res.insert(num);//加入结果集
}
}
return vector<int>(res.begin(),res.end());//最后需要返回vector
}
当然我们的结果集也需要是一个unordered_set,因为如果是vector的话还会出现重复的值。
输出重复
这是上一题的升级版,因为输出可以重复。
比如:输入:nums1 = [1,2,2,1], nums2 = [2,2]
输出为[2,2]
可能我们会有这样几种猜想:
-
如果用unordered_set存nums1,用vector存结果,是不是就可以了呢?
从这个例子来看的话,结果确实是对的。但这仅限于两个数组交集数量相等时,比如[4,9,5]和[9,4,9,8,4],如果遇到一个存放到vector一次,结果就会变成[9,4,9,4],明显不对。
-
既然允许重复,那我用两个unordered_multiset是不是可以呢?
同样对于上面的例子来说,multi允许重复,输出结果也是重复的。
核心思路为:记录nums1中数值的数量,然后nums2比较的过程中抵消。比如nums1中只有[4,9],nums2中在遇到[4,9]时就会让计数减少,这样再碰到另一对[4,9]时就不会记录了。
所以最合适的数据结构是unordered_map。记录key和对应的数量。
vector<int> intersect(vector<int>& nums1, vector<int>& nums2) {
unordered_map<int,int>nums_map;
vector<int>res;
for(int m:nums1){
nums_map[m]++;
}
for(int num:nums2){
if(nums_map.count(num)&&nums_map[num]!=0){//最重要的条件
nums_set[num]--;
res.push_back(num);
}
}
return res;
}
逻辑和上题类似,主要是判断条件,要加一个不等于0,否则即使对应的数量为0还会继续记录到vector。
快乐数
这是一道有些数学性质的题目
快乐数,就是把一个数根据每一位拆成几个数,在求这些数的平方和,一直重复这个过程。如果变为1则是快乐数。
对于这样重复计算,除了到1还会如何呢?有一个数学证明。
我们简略这个过程(求极限)得到结果,只会有两种情况:得到1或者一直循环
比如116。平方和1+1+36=38,接下来是73,58,89,145,42,20,4,16,37,又回到了58,进入循环。
所以我们的方法也分为两步:
- 计算平方和
- 在集合中寻找有没有这个数曾出现过,有就不用继续算了。
这里不重复的结果集我们用unordered_set
计算函数:
int getSum(int n){
int sum=0;
while(n){
sum+=(n%10)*(n%10);
n/=10;
}
return sum;
}
这里的技巧是我们常用的分解数字的技巧。n%10是个位,n/10是除去个位前面的位。
判断是否为快乐数:
bool isHappy(int n) {
unordered_set<int> nums;
while(1){
int sum=getSum(n);
if(sum==1)//是1就返回
return true;
if(!nums.count(sum)){//看看集合有没有,没有就加入
nums.insert(sum);
}
else//已经出现就跳出循环
return false;
n=sum;//求出的值是新的n
}
}
首先明确是一个while(1)一直进行的循环,只有在遇到1或者求出相同的数时才退出。
为什么要用unordered_set而不是数组之类的?
因为我们检查是否存在时,其他数据结构的时间复杂度是O(n),而哈希的时间复杂度是O(1)
字符串有关的哈希
再说两个和字符串有关系的使用哈希表的题目。
其实对于这些数据结构,比如字符串,数组等等,他们有时候使用的方法是一致的,比如双指针,滑动窗口。
可以纵向总结也可以横向总结。
有效的字母异位词
前面我们在滑动窗口就遇到了异位词这个概念。其实就是一个字符串的排列。
给定一个字符串s,判断另一个字符串t是不是它的字母异位词。
比如s=“rat”,t=“tar”,那就是异位词。
我们用一个集合就可以搞定,不需要滑动窗口那么复杂。
为什么呢?因为要比较的子串大小是固定的,都是一样长的,不需要滑动来控制大小。
用一个集合把字母对应的个数存入,再遍历另一个子串时减少相应的个数。如果最后都为0则说明是异位词。
bool isAnagram(string s, string t) {
int record[26]={0};
for(int i=0;i<s.size();i++){
record[s[i]-'a']++;
}
for(int j=0;j<t.size();j++){
record[t[j]-'a']--;
}
for(int i=0;i<26;i++){
if(record[i]!=0)
return false;
}
return true;
}
这里直接用一个数组来代替map,数组的下标可以对应ASCII码,这样就省去了map<char,int>的操作。
赎金信
简单来说就是两个字符串a和b,判断a能不能由b里面的字符构成,每个字符只能使用一次
比如a=“aa”,b="aab"就可以,而a=“aa”,b="ab"就不可以
逻辑和上面的题有一点点区别,上题要求的是完全吻合,而这道题只要够就可以了。
**也就是b中的字符>=a就可以了。**所以相减完只要大于等于0即返回true。
这次我们用新特性来写:
bool canConstruct(string ransomNote, string magazine) {
int record[26]={0};
for(char str1:magazine){
record[str1-'a']++;
}
for(char str2:ransomNote){
record[str2-'a']--;
}
for(int num:record){
if(num<0)
return false;
}
return true;
}