Top—K问题求解

本文介绍了一种利用堆结构和快速排序思想来找出一组数中最大的K个数的算法。首先通过堆调整创建大小为K的堆,然后依次与剩余数进行比较筛选,最终输出最大的K个数。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

求n个数中最大的K个。

方法一:

采用堆,建立一个大小为K的堆,然后依次与n个数进行比较。

void topK(int a[],int n,int k)
{
	int i;
	for(i=(k-1)/2;i>=0;i--)
	{
		heapAdjust(a,k,i);
	}
	for(i=k;i<n;i++)
	{
		if(a[0]<a[k])
		{
			int temp=a[0];
			a[0]=a[k];
			a[k]=temp;
			heapAdjust(a,k,0);
		}
	}
	printf("\n");
	for(i=0;i<k;i++)
	{
		printf("%d ",a[i]);
	}
}


其中heapAdjust代码为:

void heapAdjust(int a[],int n,int i)
{
	int temp=a[i];
	int j;
	for(j=2*i+1;j<n;j=j*2+1)
	{
		if(j+1<n && a[j+1]<a[j])
		{
			++j;
		}
		if(a[j]<temp)
		{
			a[i]=a[j];
			i=j;
		}
		else
		{
			break;
		}
	}
	a[i]=temp;
}


方法二:

采用快排思想

void topK2(int a[],int l,int r,int k)
{
	int i=l,j=r;
	int temp=a[l];
	while(i<j)
	{
		while(i<j&&a[j]>temp)
		{
			j--;
		}
		a[i]=a[j];
		i++;
		while(i<j &&a[i]<temp)
		{
			i++;
		}
		a[j]=a[i];
		j--;
	}
	a[i]=temp;

	if(r-i+1>k)
	{
		topK2(a,i+1,r,k);
	}
	else if(r-i+1<k)
	{
		topK2(a,l,i-1,k-r-1+i);
	}
	else
	{
		return;
	}
}


 

### 使用不同排序算法解决TOP K问题 #### 排序法 对于数据集较小且存在排序需求的情况下,可以直接应用排序方法来获取前K个元素。此方法涉及先对整个集合执行一次完整的排序操作,之后选取排序后的前K个元素作为结果。这种方法虽然直观易懂,但在处理大规模数据时效率低下,因为其时间复杂度达到O(n log n)[^3]。 ```python def top_k_with_sorting(nums, k): sorted_nums = sorted(nums, reverse=True) # 对列表进行降序排列 return sorted_nums[:k] # 返回前k个最大的数 ``` #### 堆排序法 当面对的数据规模庞大而所需选出的K远小于总数量N时,采用堆排序是一种更为高效的选择。通过构建一个小根堆(用于寻找最大值)或大根堆(用于寻找最小值),可以在遍历过程中动态保持住当前遇到的最大/小的K项记录。该策略能够显著减少不必要的比较次数,并将整体性能控制在较为合理的范围内,即平均情况下为O(n log k),其中n代表输入序列长度[k][^4]。 具体来说,在Python中可以通过`heapq`模块轻松实现这一逻辑: ```python import heapq def top_k_with_heap(nums, k): min_heap = nums[:k] heapq.heapify(min_heap) # 初始化大小为k的小顶堆 for num in nums[k:]: if num > min_heap[0]: heapq.heappop(min_heap) heapq.heappush(min_heap, num) return [item for item in reversed([heapq.heappop(min_heap) for _ in range(len(min_heap))])] ``` #### 快速选择法 (QuickSelect) 作为一种基于划分技术的概率型算法,快速选择能够在期望时间内以线性复杂度完成任务——即O(n)。尽管最坏情形下会退化至平方级别(O(n²)),但对于大多数实际应用场景而言已经足够优秀。它的工作原理类似于快速排序中的分区过程,只不过只关注一侧子区间直到定位到目标位置为止。 以下是使用Python实现的一个版本: ```python from random import randint def partition(arr, low, high): pivot_index = randint(low, high) arr[pivot_index], arr[high] = arr[high], arr[pivot_index] i = low - 1 for j in range(low, high): if arr[j] >= arr[high]: # 寻找较大的元素 i += 1 arr[i], arr[j] = arr[j], arr[i] arr[i + 1], arr[high] = arr[high], arr[i + 1] return i + 1 def quick_select_top_k(arr, k, start=None, end=None): if not isinstance(start, int): # 默认参数设置 start = 0 end = len(arr) - 1 while True: pos = partition(arr, start, end) if pos < k-1: # 如果pivot左边少于k个,则继续查找右侧部分 start = pos + 1 elif pos > k-1: # 同理,如果多于则转向左侧 end = pos - 1 else: # 找到了第k大的元素所在的位置 break return arr[:pos+1] nums = [7, 10, 4, 3, 20, 15] print(quick_select_top_k(nums.copy(), 3)) ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值