谨防哈希表刺客
最近在刷哈希表,发现有一些题只用哈希表来做是非常麻烦、需要考虑非常多细节的(比如 需要在数组中找到不重复的子集):
掘金的算法例题:
彩带截取优化问题
问题描述:
小U有一条彩带,每一厘米都被涂上了一种颜色。她需要从彩带上截取一段,使得这段彩带 中的颜色种类不超过K种。为了满足任务要求,小U希望截取的彩带段尽可能长。现在你需 要帮助小U计算出满足条件的最长彩带段的长度。 例如:彩带的长度为8,每个颜色的编号是1,2,3,2,1,4,5,1,小U最多允许3种 不同的颜色。此时,最长的满足条件的彩带段是1,2,3,2,1,长度为5。
这道题乍一看用哈希表直接统计所有遍历到的彩带颜色就好了,如果哈希表大小>K,就说明目前的截取区间 包含的颜色种类大于K种了。但是我们发现:
1、暴力地多重循环不仅会导致超时,哈希表也有包含重复的截取情况,于是我们考虑用滑动窗口来求解。
2、滑动窗口的右端滑到数组最后一个元素时,我们需要结合目前哈希表的大小进行不同的处理。详情看 18-28行,我们默认将 数组最后一个元素 加入到我们的计数中,然后在下一次循环的开头,判断现在的哈希表大小是否已经超过K了,如果是,我们就把得到的数量-1;如果是其他情况,则不变。
#include <algorithm>
#include <iostream>
#include <vector>
#include "map"
using namespace std;
int solution(int N, int K, vector<int> a) {
// 这道题使用滑动窗口 + 哈希表
if(N==1)return 1;
map<int, int> now;
int i=0;
int j=0;
int maxnum=0;
int temp=0;
while(i<N)
{
if(j==N || now.size()>K)//还可能后面有满足条件的
{
if(j==N && now.size()<=K)
maxnum=max(maxnum,temp);
else
maxnum=max(maxnum,temp-1);
now.clear();
temp=0;
i++;
j=i;
}
else if (now.size()<=K && j<N) {
now[a[j]]++;
temp++;
j++;
}
}
return maxnum;
}
int main() {
cout << (solution(8, 3, {1, 2, 3, 2, 1, 4, 5, 1}) == 5) << endl;
cout << (solution(7, 2, {1, 2, 2, 2, 1, 1, 3}) == 6) << endl;
cout << (solution(6, 4, {4, 5, 4, 6, 7, 8}) == 5) << endl;
return 0;
}
还有一些类似的哈希表刺客,乍一看使用哈希表就可以破解,实则使用双指针法可以走很多弯路,比如:
三数之和
问题描述
给你一个整数数组 nums
,判断是否存在三元组 [nums[i], nums[j], nums[k]]
满足 i != j
、i != k
且 j != k
,同时还满足 nums[i] + nums[j] + nums[k] == 0
。请你返回所有和为 0
且不重复的三元组。
注意: 答案中不可以包含重复的三元组
两层for循环就可以确定 a 和b 的数值了,可以使用哈希法来确定 0-(a+b) 是否在 数组里出现过,其实这个思路是正确的,但是我们有一个非常棘手的问题,就是题目中说的不可以包含重复的三元组。
把符合条件的三元组放进vector中,然后再去重,这样是非常费时的,很容易超时,也是这道题目通过率如此之低的根源所在。
去重的过程不好处理,有很多小细节,如果在面试中很难想到位。
时间复杂度可以做到O(n^2),但还是比较费时的,因为不好做剪枝操作。
这道题目使用双指针法 要比哈希法高效一些:
class Solution {
public:
vector<vector<int>> threeSum(vector<int>& nums) {
vector<vector<int>> result;
sort(nums.begin(), nums.end());
// 找出a + b + c = 0
// a = nums[i], b = nums[left], c = nums[right]
for (int i = 0; i < nums.size(); i++) {
// 排序之后如果第一个元素已经大于零,那么无论如何组合都不可能凑成三元组,直接返回结果就可以了
if (nums[i] > 0) {
return result;
}
// 错误去重a方法,将会漏掉-1,-1,2 这种情况
/*
if (nums[i] == nums[i + 1]) {
continue;
}
*/
// 正确去重a方法
if (i > 0 && nums[i] == nums[i - 1]) {
continue;
}
int left = i + 1;
int right = nums.size() - 1;
while (right > left) {
// 去重复逻辑如果放在这里,0,0,0 的情况,可能直接导致 right<=left 了,从而漏掉了 0,0,0 这种三元组
/*
while (right > left && nums[right] == nums[right - 1]) right--;
while (right > left && nums[left] == nums[left + 1]) left++;
*/
if (nums[i] + nums[left] + nums[right] > 0) right--;
else if (nums[i] + nums[left] + nums[right] < 0) left++;
else {
result.push_back(vector<int>{nums[i], nums[left], nums[right]});
// 去重逻辑应该放在找到一个三元组之后,对b 和 c去重
while (right > left && nums[right] == nums[right - 1]) right--;
while (right > left && nums[left] == nums[left + 1]) left++;
// 找到答案时,双指针同时收缩
right--;
left++;
}
}
}
return result;
}
};