题目描述:
输入n个整数,找出其中最小的K个数。例如输入4,5,1,6,2,7,3,8这8个数字,则最小的4个数字是1,2,3,4。
解题思路:
方法一:
原理类似于博客数组中出现次数超过一半的数的方法一,参考链接:https://blog.youkuaiyun.com/Victory_tc/article/details/87566304
方法二:
利用大顶堆(multiset)来存储最小的k个数;首先当大定堆中元素个数小于K时,将数组中的元素插入其中;然后当大定堆中有了k个以后,将数组中当前遍历元素与之比较,小于堆顶元素,则堆顶元素不可能是最小的k个数之一,所以将其删除后,插入当前的数组元素;以此遍历完数组,大顶推中便是最小的k个数。
方法总结:
1)方法一时间复杂度O(n),但是要变动原数组元素的位置;方法二时间复杂度为O(nlogk)(大顶堆的插入,删除时间复杂度都为O(logk)),适用于处理海量数据(n非常大,以至于不能一次性载入内存中,k较小)。
2)方法一不适合海量数据,变动了原数组,但是时间复杂度较低;方法二适用于海量数据,没有变动原数组。
通过代码(C++):
方法一:
class Solution {
public:
vector<int> GetLeastNumbers_Solution(vector<int> input, int k) {
vector<int> result;
if(input.empty() || k > input.size() || k <= 0)
return result;
int middle = k-1;
int start = 0;
int end = input.size() - 1;
int index = partion(input,start,end);
while(index != middle)
{
if(index > middle)
{
end = index - 1;
}
else
{
start = index + 1;
}
index = partion(input,start,end);
}
//判断输入是否存在超过数组长度一半的数
result.assign(input.begin(),input.begin()+k);
return result;
}
//快速排序的基础,返回选中的基准值在数组中的位置
int partion(vector<int>&numbers, int start, int end)
{
int len = numbers.size();
if(numbers.empty() || start < 0 || end >= len)
return -1;
//产生start-end的随机数
int index = RandomInRange(start,end);
swap(numbers[index],numbers[end]);
int small = start - 1;
for(index = start; index < end; ++index)
{
if(numbers[index] < numbers[end])
{
++small;
if(small != index)
swap(numbers[small],numbers[index]);
}
}
++small;
swap(numbers[small],numbers[end]);
return small;
}
//产生[start,end]的随机数
int RandomInRange(int start,int end)
{
std::mt19937 rng;//随机数类型
rng.seed(std::random_device()());//初始化随机数种子
//创建一个均匀分布,这个均匀分布可以等概率(随机)生成[start,end]区间的整形数字;
std::uniform_int_distribution<int> dist(start,end);
return dist(rng);
}
};
方法二:
#include<set>
class Solution {
public:
vector<int> GetLeastNumbers_Solution(vector<int> input, int k) {
vector<int> result;
if(input.empty() || k > input.size() || k <= 0)
return result;
std::multiset<int,greater<int>> auxiliarySet;
std::vector<int>::const_iterator iter = input.begin();
for(; iter != input.end(); ++iter)
{
if(auxiliarySet.size() < k)
{
auxiliarySet.insert(*iter);
}
else
{
if(*iter < *(auxiliarySet.begin()))
{
std::multiset<int,greater<int>>::iterator iterSet = auxiliarySet.begin();
auxiliarySet.erase(iterSet);
auxiliarySet.insert(*iter);
}
}
}
std::multiset<int,greater<int>>::iterator iterSet = auxiliarySet.begin();
for(;iterSet != auxiliarySet.end(); ++iterSet)
{
result.push_back(*iterSet);
}
return result;
}
};