例题
力扣题目链接
https://leetcode.cn/problems/3sum/
题目说明
给你一个包含 n
个整数的数组 nums
,判断 nums
中是否存在三个元素 a,b,c
,使得
a
+
b
+
c
=
0
a + b + c = 0
a+b+c=0 ?请你找出所有和为 0
且不重复的三元组。
注意:答案中不可以包含重复的三元组。
示例 1:
输入:nums = [-1,0,1,2,-1,-4]
输出:[[-1,-1,2],[-1,0,1]]
示例 2:
输入:nums = []
输出:[]
示例 3:
输入:nums = [0]
输出:[]
提示:
- 0 ≤ n u m s . l e n g t h ≤ 3000 0 \leq nums.length \leq 3000 0≤nums.length≤3000
- − 105 ≤ n u m s [ i ] ≤ 105 -105 \leq nums[i] \leq 105 −105≤nums[i]≤105
本题与 两数之和 类似,是非常经典的面试题,但是做法不尽相同。
解题方法
方法一:排序 + 双指针
题目中要求找到所有「不重复」且和为 0
的三元组,这个「不重复」的要求使得我们无法简单地使用三重循环枚举所有的三元组。这是因为在最坏的情况下,数组中的元素全部为 0
,即
[ 0 , 0 , 0 , 0 , 0 , . . . , 0 , 0 , 0 ] [0, 0, 0, 0, 0, ..., 0, 0, 0] [0,0,0,0,0,...,0,0,0]
任意一个三元组的和都为 0
。如果我们直接使用三重循环枚举三元组,会得到
O
(
N
3
)
O(N^3)
O(N3)个满足题目要求的三元组(其中
N
N
N 是数组的长度)时间复杂度至少为
O
(
N
3
)
O(N^3)
O(N3)。在这之后,我们还需要使用哈希表进行去重操作,得到不包含重复三元组的最终答案,又消耗了大量的空间。这个做法的时间复杂度和空间复杂度都很高,因此我们要换一种思路来考虑这个问题。
「不重复」的本质是什么?我们保持三重循环的大框架不变,只需要保证:
-
第二重循环枚举到的元素不小于当前第一重循环枚举到的元素;
-
第三重循环枚举到的元素不小于当前第二重循环枚举到的元素。
也就是说,我们枚举的三元组 ( a , b , c ) (a, b, c) (a,b,c) 满足 a ≤ b ≤ c a \leq b \leq c a≤b≤c,保证了只有 ( a , b , c ) (a, b, c) (a,b,c)这个顺序会被枚举到,而 ( b , a , c ) (b, a, c) (b,a,c)、 ( c , b , a ) (c, b, a) (c,b,a) 等等这些不会,这样就减少了重复。要实现这一点,我们可以将数组中的元素从小到大进行排序,随后使用普通的三重循环就可以满足上面的要求。
同时,对于每一重循环而言,相邻两次枚举的元素不能相同,否则也会造成重复。举个例子,如果排完序的数组为
[0, 1, 2, 2, 2, 3]
^ ^ ^
我们使用三重循环枚举到的第一个三元组为
(
0
,
1
,
2
)
(0, 1, 2)
(0,1,2),如果第三重循环继续枚举下一个元素,那么仍然是三元组
(
0
,
1
,
2
)
(0, 1, 2)
(0,1,2),产生了重复。因此我们需要将第三重循环「跳到」下一个不相同的元素,即数组中的最后一个元素 3
,枚举三元组
(
0
,
1
,
3
)
(0, 1, 3)
(0,1,3)。
下面给出了改进的方法的伪代码实现:
nums.sort()
for first = 0 .. n-1
// 只有和上一次枚举的元素不相同,我们才会进行枚举
if first == 0 or nums[first] != nums[first-1] then
for second = first+1 .. n-1
if second == first+1 or nums[second] != nums[second-1] then
for third = second+1 .. n-1
if third == second+1 or nums[third] != nums[third-1] then
// 判断是否有 a+b+c==0
check(first, second, third)
这种方法的时间复杂度仍然为 O ( N 3 ) O(N^3) O(N3),毕竟我们还是没有跳出三重循环的大框架。然而它是很容易继续优化的,可以发现,如果我们固定了前两重循环枚举到的元素 a a a 和 b b b,那么只有唯一的 c c c 满足 a + b + c = 0 a+b+c=0 a+b+c=0。当第二重循环往后枚举一个元素 b ′ b' b′时,由于 b ′ > b b' > b b′>b,那么满足 a + b ′ + c ′ = 0 a+b'+c'=0 a+b′+c′=0 的 c ′ c' c′一定有 c ′ < c c' < c c′<c,即 c ′ c' c′ 在数组中一定出现在 c c c 的左侧。也就是说,我们可以从小到大枚举 b b b,同时从大到小枚举 c c c,即第二重循环和第三重循环实际上是并列的关系。
有了这样的发现,我们就可以保持第二重循环不变,而将第三重循环变成一个从数组最右端开始向左移动的指针,从而得到下面的伪代码:
nums.sort()
for first = 0 .. n-1
if first == 0 or nums[first] != nums[first-1] then
// 第三重循环对应的指针
third = n-1
for second = first+1 .. n-1
if second == first+1 or nums[second] != nums[second-1] then
// 向左移动指针,直到 a+b+c 不大于 0
while nums[first]+nums[second]+nums[third] > 0
third = third-1
// 判断是否有 a+b+c==0
check(first, second, third)
这个方法就是我们常说的「双指针」,当我们需要枚举数组中的两个元素时,如果我们发现随着第一个元素的递增,第二个元素是递减的,那么就可以使用双指针的方法,将枚举的时间复杂度从 O ( N 2 ) O(N^2) O(N2)减少至 O ( N ) O(N) O(N)。为什么是 O ( N ) O(N) O(N) 呢?这是因为在枚举的过程每一步中,「左指针」会向右移动一个位置(也就是题目中的 b b b),而「右指针」会向左移动若干个位置,这个与数组的元素有关,但我们知道它一共会移动的位置数为 O ( N ) O(N) O(N),均摊下来,每次也向左移动一个位置,因此时间复杂度为 O ( N ) O(N) O(N)。
注意到我们的伪代码中还有第一重循环,时间复杂度为 O ( N ) O(N) O(N),因此枚举的总时间复杂度为 O ( N 2 ) O(N^2) O(N2)。由于排序的时间复杂度为 O ( N log N ) O(N \log N) O(NlogN),在渐进意义下小于前者,因此算法的总时间复杂度为 O ( N 2 ) O(N^2) O(N2)。
上述的伪代码中还有一些细节需要补充,例如我们需要保持左指针一直在右指针的左侧(即满足 b ≤ c b \leq c b≤c),具体可以参考下面的代码,均给出了详细的注释。
代码
C++
class Solution {
public:
vector<vector<int>> threeSum(vector<int>& nums) {
int n = nums.size();
sort(nums.begin(), nums.end());
vector<vector<int>> ans;
// 枚举 a
for (int first = 0; first < n; ++first) {
// 需要和上一次枚举的数不相同
if (first > 0 && nums[first] == nums[first - 1]) {
continue;
}
// c 对应的指针初始指向数组的最右端
int third = n - 1;
int target = -nums[first];
// 枚举 b
for (int second = first + 1; second < n; ++second) {
// 需要和上一次枚举的数不相同
if (second > first + 1 && nums[second] == nums[second - 1]) {
continue;
}
// 需要保证 b 的指针在 c 的指针的左侧
while (second < third && nums[second] + nums[third] > target) {
--third;
}
// 如果指针重合,随着 b 后续的增加
// 就不会有满足 a+b+c=0 并且 b<c 的 c 了,可以退出循环
if (second == third) {
break;
}
if (nums[second] + nums[third] == target) {
ans.push_back({nums[first], nums[second], nums[third]});
}
}
}
return ans;
}
};
Python3
class Solution:
def threeSum(self, nums: List[int]) -> List[List[int]]:
n = len(nums)
nums.sort()
ans = list()
# 枚举 a
for first in range(n):
# 需要和上一次枚举的数不相同
if first > 0 and nums[first] == nums[first - 1]:
continue
# c 对应的指针初始指向数组的最右端
third = n - 1
target = -nums[first]
# 枚举 b
for second in range(first + 1, n):
# 需要和上一次枚举的数不相同
if second > first + 1 and nums[second] == nums[second - 1]:
continue
# 需要保证 b 的指针在 c 的指针的左侧
while second < third and nums[second] + nums[third] > target:
third -= 1
# 如果指针重合,随着 b 后续的增加
# 就不会有满足 a+b+c=0 并且 b<c 的 c 了,可以退出循环
if second == third:
break
if nums[second] + nums[third] == target:
ans.append([nums[first], nums[second], nums[third]])
return ans
复杂度分析
-
时间复杂度: O ( N 2 ) O(N^2) O(N2),其中 NN 是数组 nums \textit{nums} nums 的长度。
-
空间复杂度: O ( log N ) O(\log N) O(logN)。我们忽略存储答案的空间,额外的排序的空间复杂度为 O ( log N ) O(\log N) O(logN)。然而我们修改了输入的数组 nums \textit{nums} nums,在实际情况下不一定允许,因此也可以看成使用了一个额外的数组存储了 nums \textit{nums} nums 的副本并进行排序,空间复杂度为 O ( N ) O(N) O(N)。
方法二:哈希解法
两层for
循环就可以确定 a
和b
的数值了,可以使用哈希法来确定
0
−
(
a
+
b
)
0-(a+b)
0−(a+b) 是否在 数组里出现过,其实这个思路是正确的,但是我们有一个非常棘手的问题,就是题目中说的不可以包含重复的三元组。
把符合条件的三元组放进vector
中,然后再去重,这样是非常费时的,很容易超时,也是这道题目通过率如此之低的根源所在。
去重的过程不好处理,有很多小细节,如果在面试中很难想到位。
时间复杂度可以做到 O ( n 2 ) O(n^2) O(n2),但还是比较费时的,因为不好做剪枝操作。
大家可以尝试使用哈希法写一写,就知道其困难的程度了。
哈希法C++代码:
class Solution {
public:
vector<vector<int>> threeSum(vector<int>& nums) {
vector<vector<int>> result;
sort(nums.begin(), nums.end());
// 找出a + b + c = 0
// a = nums[i], b = nums[j], c = -(a + b)
for (int i = 0; i < nums.size(); i++) {
// 排序之后如果第一个元素已经大于零,那么不可能凑成三元组
if (nums[i] > 0) {
break;
}
if (i > 0 && nums[i] == nums[i - 1]) { //三元组元素a去重
continue;
}
unordered_set<int> set;
for (int j = i + 1; j < nums.size(); j++) {
if (j > i + 2
&& nums[j] == nums[j-1]
&& nums[j-1] == nums[j-2]) { // 三元组元素b去重
continue;
}
int c = 0 - (nums[i] + nums[j]);
if (set.find(c) != set.end()) {
result.push_back({nums[i], nums[j], c});
set.erase(c);// 三元组元素c去重
} else {
set.insert(nums[j]);
}
}
}
return result;
}
};