最早遇到这个问题实在<算法导论>的试题中,当时没有找到好的解决方法,后来在<编程之美>中遇到了同样的问题。
问题是这样的:
有n个ID,其中有个ID出现的次数超过了总数的一半,求此ID。
如果不考虑算法的时间复杂度,几乎没有人会解不出这个问题。但如果ID的个数是海量的,几十MB,几百MB甚至有数GB,那么不考虑时间复杂度是不能忍受的。
下面是高效解决此问题的思路:
每次删除两个不同的ID,最后剩下的ID即是所求的ID。算法如下:
int findID(int id[], int N) { //设ID为整型
int candidate, i;
int repeat;
for (repeat = i = 0;i < N;i++) {
if (repeat == 0) {
candidate = id[i]; //当前没有两个相同的ID
repeat = 1; //相同的ID的个数计数
} else {
if (candidate == id[i]) //当前遇到相同的ID
repeat++; //相同的ID数加1
else
repeat--; //相同的ID数减1
}
}//for
return candidate;
}
时间复杂度为O(N)。