求前K个数

本文探讨了从十亿个数中找出最大的一百万个数的有效算法。介绍了三种方法:直接排序、使用小顶堆及快速排序思想的划分策略,并分析了各自的适用场景与时间复杂度。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

描述一个算法,在十亿个(n)数中找出前一百万(k)大的数字。假设内存里可以放下十亿个数。

思路:

1、直接排序,然后输出前一百万个数,时间复杂度为O(n*logn)。

2、维护一个大小为一百万的小顶推,然后遍历完十亿个数,输出小顶推的数即可,时间复杂度为O(n*logk)。该思路适合大数据,尤其是内存放不下所有数据的时候。

3、利用快排的思想进行划分,一次划分后设主元的位置为index,如果index == k,输出前k个数;如果index > k,继续在左半部分进行划分寻找k;如果index < k,输出左半部分的数,继续在右半部分进行划分寻找剩下的k - index个数。时间复杂度为O(n)。

类似的题有:找出n个数中第k大(小)的数。

C++中的Heapsort算法是一种基于二叉堆数据结构的排序方法,特别适合用于找出一组元素中的K个最小值。这里我们先简要介绍Heap这个数据结构: - **堆**(Heap)是一个特殊的树形数据结构,通常分为最大堆(Max Heap)和最小堆(Min Heap)。最大堆的根节点总是比其他节点大,而最小堆则相反,根节点是最小的。 为了找到K个最小值,我们可以采用“剩余堆”(Residual Heap)的概念,也就是在原始数组上构建一个最小堆,然后依次从堆顶取出元素并更新堆,直到取出了K个元素。以下是基本步骤: 1. 初始化:创建一个大小为K的小顶堆,将其初始化为空。 2. 建堆:遍历原始数组,将K个元素插入到堆中,保证堆的性质。 3. 排序:从第K+1个元素开始,如果该元素小于当堆顶(即最小堆),就将堆顶元素替换为该元素,并调整堆结构,使得堆顶始终是当未考虑部分中的最小值。 4. 当遍历完整个数组时,堆中的K个元素就是K个最小值。 以下是一个简单的C++示例代码片段: ```cpp #include <vector> using namespace std; void heapify(vector<int>& arr, int n, int i) { int smallest = i; int left = 2 * i + 1; int right = 2 * i + 2; if (left < n && arr[left] < arr[smallest]) smallest = left; if (right < n && arr[right] < arr[smallest]) smallest = right; if (smallest != i) { swap(arr[i], arr[smallest]); heapify(arr, n, smallest); } } void kthSmallest(vector<int>& arr, int k) { int n = arr.size(); vector<int> minHeap(k); // 将k个元素直接插入堆 for (int i = 0; i < k; ++i) heapify(minHeap, k, i); for (int i = k; i < n; ++i) { if (arr[i] < minHeap[0]) { // 如果新元素比堆顶还小,替换堆顶并调整堆 minHeap[0] = arr[i]; heapify(minHeap, k, 0); } } // 最终堆中的k个元素就是k个最小值 for (int i = 0; i < k; ++i) cout << minHeap[i] << " "; } // 示例用法 int main() { vector<int> arr = {9, 8, 7, 6, 5, 4, 3, 2, 1}; int k = 3; kthSmallest(arr, k); return 0; } ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值