题目:如何在O(n)的时间复杂度内找出数组中出现次数超过了一半的数。
由于本题对时间复杂度有要求,所以可采用以下2种方法。
方法一:每次取出两个不同的数,剩下的数字中重复出现的数字肯定比其他数字多,将规模缩小化。如果每次删除两个不同的数(不管包括不包括最高频数),那么在剩余的数字里,原最高频数出现的频率一样超过了50%,不断重复这个过程,最后剩下的将全是同样的数字,即最高频数。此算法避免了排序,时间复杂度只有O(n),空间复杂度为O(1)。
#include <iostream>
int FindMostData(int arr[], int len)
{
int findNum = 0; // 出现次数超过一半的数;
int count = 0; // 只要最终count > 0,那么对应的findNum就是出现次数超过一半的数;
// 循环过程中,i每增加一次,就相当于把i之前的所有元素(除了满足“findNum == arr[i]”条件的arr[i],这些对应元素用“count++”来标记)都抛弃了,但是之后每当执行一次“ count-- ”时,又会从前面这些已保留的且等于findNum的元素中删除一项,直到count == 0,再重选findNum;
for (int i = 0; i < len; i++)
{
if (count == 0) // count为0时,表示当前的findNum需要重选;
{
findNum = arr[i];
count = 1;
}
else
{
if (findNum == arr[i])
count++;
else
count--;
}
}
return findNum;
}
int main(int argc, const char * argv[]) {
int arr[] = {1,2,3,2,5,2,2,6,2,2,2};
int len = sizeof(arr)/sizeof(int);
printf("出现次数超过一半的数是 %d\n", FindMostData(arr, len));
return 0;
}
输出如下:
方法二:hash法。首先创建一个hash_map,其中key为数组元素值,value为此数出现的次数。遍历一遍数组,用hash_map统计每个数出现的次数,并用两个值存储目前出现次数最多的数和对应出现的次数,此时的时间复杂度为 O(n),空间复杂度为O(n),满足题目的要求。
备注:如果对时间复杂度没有要求,那么可以先对数组排序,然后取中间元素即可。因为如果某个元素的个数超过一半,那么数组排序后该元素必定占据数组的中间位置。(该方法的时间复杂度就是排序用的时间,即最快的排序算法的时间复杂度O(nlogn))。