声明:题目来自: http://blog.youkuaiyun.com/v_JULY_v/archive/2010/11/17/6015165.aspx JULY整理了100道微软等公司的面试题目,我想先不看答案: http://blog.youkuaiyun.com/v_JULY_v/archive/2011/01/10/6126406.aspx 自己先做一遍。
题目:
5. 查找最小的k 个元素
题目:输入n 个整数,输出其中最小的k 个。
例如输入1 ,2 ,3 ,4 ,5 ,6 ,7 和8 这8 个数字,则最小的4 个数字为1 ,2 ,3 和4 。
思路:
最简单的想法就是在内部分配一个K大小的数组,用于存储最小的K个数,这K个数从大到小排序 array[0..K-1],那么每次读入一个新的数 elem, 我们比较elem 和 array[0], 如果elem>array[0], 则elem肯定不是最小的K个数的候选,否则(当elem<array[0]),我们找到第一个位置P, 使得array[P-1]>elem>array[P] , 然后: array[i]=array[i+1] for all i =(0..P-2); array[P-1] = elem.
但是这样并不好,如果给定的数组是从大到小排好顺序的,那么每次我们都要遍历整个内部数组,其时间复杂度是O(N2 ).
其实我们可以把题目重新理解为:
我需要一个数据结构,
条件1) 能够在O(1)时间判断一个新的数字是不是已有的K个数字中最大的
条件2 ) 如果不是现有的K个数中最大的话,我希望在最短时间内,丢弃现有K个数中的最大的那个数,放入新的数,并且最适当调整,使调整后的数据结构仍然满足 条件1).
结果就是 最大堆 (Max Binary Heap). 对于Binary Heap,每次调整,最坏情况时间复杂度是 l