TOPK问题----代码实现打印数据中前K大的数

本文介绍了一种高效的方法来统计从10万随机整数中选取的最大10个数值。通过使用小根堆数据结构实现了一个简易的Top K算法,此算法能够有效地筛选出指定数量的最大值。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

/*
问题:
	随机产生100000个整数,范围是【0,1000】,快速统计出值最大的前10个?
*/
#include<iostream>
#include<vector>
#include<queue>
#include<ctime>
#include<functional>
using namespace std;
class TopK{
public:
	TopK()
	{
		srand(time(NULL));//初始化时间种子
		for (int i = 0; i < 100000; ++i)
		{
			v.push_back(rand() % 1000);
		}
	}
	void PrintTopK(int k)
	{
		priority_queue<int, vector<int>, greater<int>> pri;//小根堆数据结构
		
		//先维持一个k个元素的小根堆
		for (int i = 0; i < k; ++i)
		{
			pri.push(v[i]);
		}

		//一次遍历往后遍历每个数
		for (int i = k; i < v.size(); ++i)
		{
			if (v[i] > pri.top())//如果比堆顶的大,就将堆顶的元素出堆,将该元素入堆
			{//因为堆顶的元素是k个元素中最小的,比堆顶大说明可能TOPK个元素之一
				pri.pop();
				pri.push(v[i]);
			}
		}
		//遍历一次后,小根堆中的元素都是所有元素中最大的 K个数
		for (int i = 0; i < k; ++i)
		{
			cout << pri.top() << "  ";
			pri.pop();
		}
	}
	vector<int> v;
};
int main()
{
	TopK t;
	t.PrintTopK(10);
	cin.get();
	return 0;
}

### 使用Python实现TopK算法 为了实现数据中找到`k`个最或最小元素的需求,可以采用堆这一高效的数据结构来完成。下面展示了一个基于堆的`topk`函的具体实现方式。 ```python import heapq def topk(data, k, reverse=False): """ 返回列表data中的k(当reverse为True)或k小(默认情况)元素组成的有序列表。 参: data (list): 输入数据集。 k (int): 需要获取的最/最小子项量。 reverse (bool): 如果设置为True,则返回最的k个项目;如果False则相反。 返回: list: k个最/最小项目的排序列表。 """ heap = [] for item in data: if len(heap) < k: heapq.heappush(heap, item) else: # 当寻找较的k个值时,比较当item与heap中最小值; # 反之亦然,即在寻找较小的k个值时,应调整条件逻辑。 if (reverse and item > heap[0]) or (not reverse and item < heap[0]): heapq.heapreplace(heap, item) # 对最终得到的小顶堆/顶堆进行降序/升序排列并输出结果 result = sorted(heap, reverse=reverse) return result ``` 这段代码通过维护一个小不超过`k`的最小堆(用于找最值的情况)或者最堆(用于找最小值),遍历输入序列中的每一个元素,并根据实际情况更新堆内的成员[^1]。最后通过对这个固定长度的堆做一次完整的排序操作获得所需的`top-k`集合。 对于上述例子而言: ```python data = [4, 2, 7, 1, 8, 3, 5, 6] k = 3 result = topk(data, k, reverse=True) print(result) ``` 执行以上程序将会打印出列表`data`里三个最字—— `[8, 7, 6]`。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值