Given a collection of intervals, merge all overlapping intervals.
For example,
Given [1,3],[2,6],[8,10],[15,18]
,
return [1,6],[8,10],[15,18]
.
区间合并 和 求最长区间 一样,关键在于如何记录区间信息,能够降低复杂度。
最简单的思路是用一个bool数组,记录区间中的每一位是否被覆盖。
例如:
intervals: [1, 4] [8, 9] [20, 30] [7, 14] [2, 9]
设一个数组 bool f[30],初始化全部为false
[1, 4]就把f[1]..f[4]全部置为true
其他区间一次类推,最后扫描f数组,就能得到区间合并的结果。
这种做法对于小数据还行,大数据会超市。
这样做,存在很多重复工作,例如[1, 4] [8, 9] [7, 14] [2, 9]这四个区间,会反复将f[2] f[3] f[4][ f[5] f[6] f[7] f[8] f[9]设为true。
所以,我们需要考虑的是如何去除重复的工作。实际上,两个端点就能描述出一个区间,关键在于如何标记出两个端点,让我们在扫描时能够知道这个区间被覆盖。
一个很巧妙的做法就是进入一个区间就加1,出一个区间就减1,如果数值大于0,说明当前处于一个区间中。
还是以刚刚的intervals为例。
设数组 int l[30], r[30],初始化全部为0
[1, 4]:l[1]++, r[4]--
[8, 9]:l[8]++, r[9]--
...
扫描时,用一个count记录,每次:
count += l[i],如果count>0说明i处于一个区间中
count -= r[i],如果count==0说明i是一个区间的尾端点
/**
* Definition for an interval.
* struct Interval {
* int start;
* int end;
* Interval() : start(0), end(0) {}
* Interval(int s, int e) : start(s), end(e) {}
* };
*/
class Solution {
public:
vector<Interval> merge(vector<Interval> &intervals) {
// Start typing your C/C++ solution below
// DO NOT write int main() function
vector<Interval> answer;
if (intervals.empty()) {
return answer;
}
int min = 1000000, max = -1000000;
for (vector<Interval>::iterator iter = intervals.begin(); iter != intervals.end(); iter++) {
min = min < iter->start ? min : iter->start;
max = max > iter->end ? max : iter->end;
}
int left[max - min + 1];
int right[max - min + 1];
memset(left, 0, sizeof(int) * (max - min + 1));
memset(right, 0, sizeof(int) * (max - min + 1));
for (vector<Interval>::iterator iter = intervals.begin(); iter != intervals.end(); iter++) {
left[iter->start - min]++;
right[iter->end - min]++;
}
int start = -1, count = 0;
for (int i = 0; i < max - min + 1; i++) {
count += left[i];
if (count > 0 && start == -1) {
start = i;
}
count -= right[i];
if (count == 0 && start != -1) {
answer.push_back(Interval(start + min, i + min));
start = -1;
}
}
return answer;
}
};