题意
给定两个数组,求它们的交(不去重)
思路
算法1
利用unordered_map的,将size较大的那一个数组存到map(has)里面,has[x] = tot,代表在第一个数组内x有多少个,然后对较小的那个数组内的每个元素进行遍历并在has内查找,每次找到hax[x]–。
时间复杂度:设较小的数组大小为m,较大的数组大小为n,好像unordered_map的插入时间为O(1),那么总的时间复杂度为O(m+n)。
算法2
将两个数组排序,设置两个指针i和j分别指向两个数组的首元素,然后进行如上题一样的遍历即可。
时间复杂度:O(mlogm+nlogn)。
Follow up
Leetcode上给了这样三个思考题:
如果两个数组已经排好序了, 哪个算法更优?
既然两个数组已经排好序了,显然算法2更优,i和j只需要分别遍历一遍自己指向的数组即可,时间复杂度O(m+n)。如果nums1的大小 < nums2的大小,哪个算法更优?
这时候,可以利用我们的算法1,将nums2存在map里面,然后对nums1内的每个元素进行遍历并在nums2的map内进行查找即可。如果nums2存在磁盘上的,内存有限,于是你不能一次全部读入nums2,那么应该怎样做?
I. 如果考虑我们的算法1:这时候我们没办法对nums2进行hash了,于是我们对nums1进行hash,然后每次读入nums2的部分元素,然后在nums1的hash_table里面进行查找即可。
II. 如果考虑我们的算法那2:算法2是基于排序的算法,那么我们只有利用一系列外部排序的算法对nums2进行排序,然后每次读入nums2的部分元素。
代码
//algorithm1: based on hash
class Solution {
public:
vector<int> solve(vector<int>& tohash, vector<int>& a) {
unordered_map<int, int> has;
vector<int> res;
for (auto x : tohash) {
if (has.find(x) != has.end()) has[x]++;
else has[x] = 1;
}
for (auto x : a) {
if (has.find(x) != has.end() && has[x]) {
res.push_back(x);
has[x]--;
}
}
return res;
}
vector<int> intersect(vector<int>& nums1, vector<int>& nums2) {
vector<int> res;
if (nums1.size() > nums2.size()) res = solve(nums1, nums2);
else res = solve(nums2, nums1);
return res;
}
};
//algorithm2: based on sort and two pointers
class Solution {
public:
vector<int> intersect(vector<int>& nums1, vector<int>& nums2) {
int i = 0, j = 0;
vector<int> res;
sort(nums1.begin(), nums1.end());
sort(nums2.begin(), nums2.end());
while (i < nums1.size() && j < nums2.size()) {
if (nums1[i] == nums2[j]) {
res.push_back(nums1[i]);
i++; j++;
}
else if (nums1[i] < nums2[j]) i++;
else j++;
}
return res;
}
};