题目:
Given two arrays, write a function to compute their intersection.
Example:
Given nums1 = [1, 2, 2, 1]
, nums2 = [2,
2]
, return [2, 2]
.
Note:
- Each element in the result should appear as many times as it shows in both arrays.
- The result can be in any order.
Follow up:
- What if the given array is already sorted? How would you optimize your algorithm?
- What if nums1's size is small compared to nums2's size? Which algorithm is better?
- What if elements of nums2 are stored on disk, and the memory is limited such that you cannot load all elements into the memory at once?
思路:
这道题目本身仍然不难,下面代码片段的时间复杂度是O(n1) + O(n2),空间复杂度是O(n1),其中n1和n2分别是第一个数组和第二个数组的大小(严格来讲空间复杂度是输入敏感的,我们这里先不细究了)。但是我们需要回答好三个Follow up问题:
1)如果数组本身是排好序的,那么我们就不需要额外定义哈希表了,可以直接采用类似于归并排序的思想,对两个数组进行线性扫描,发现相同的元素的时候,记录他们出现的最小次数,并且将该次数个元素加入结果集中。此时空间复杂度可以降低到O(1)。
2)如果nums1的元素个数小于nums2,那么我们可以反过来将nums1中的数组元素放入哈希表中,这样可以将空间复杂度降低。
3)这种情况就需要分批加载nums2中的数据元素了,不过算法不会改变太多,还是先把nums1哈希出来(如果nums1的数组元素还不是太大的话)。然后就需要对nums2中的数组分批加载进来,和nums1求交。
代码:
class Solution {
public:
vector<int> intersect(vector<int>& nums1, vector<int>& nums2) {
unordered_map<int, int> hash;
for (auto val : nums1) {
++hash[val];
}
vector<int> ret;
for (auto val : nums2) {
if (hash.count(val) > 0 && hash[val] > 0) {
ret.push_back(val);
--hash[val];
}
}
return ret;
}
};