寻找第K大数的方法

本文介绍了在乱序数组中寻找第k大数的多种方法,包括排序、快速选择、堆排序、二分查找等,分析了各自的时间复杂度,并提到了STL中的nth_element和partial_sort函数。此外,还讨论了浮点数比较和搜索引擎中的相关性权重问题。

摘自:http://www.cnblogs.com/zhjp11/archive/2010/02/26/1674227.html

今天看算法分析是,看到一个这样的问题,就是在一堆数据中查找到第k个大的值。

      名称是:设计一组N个数,确定其中第k个最大值,这是一个选择问题,当然,解决这个问题的方法很多,本人在网上搜索了一番,查找到以下的方式,决定很好,推荐给大家。

所谓“第(前)k大数问题”指的是在长度为n(n>=k)的乱序数组中S找出从大到小顺序的第(前)k个数的问题。

      解法1: 我们可以对这个乱序数组按照从大到小先行排序,然后取出前k大,总的时间复杂度为O(n*logn + k)。
      解法2: 利用选择排序或交互排序,K次选择后即可得到第k大的数。总的时间复杂度为O(n*k)
      解法3: 利用快速排序的思想,从数组S中随机找出一个元素X,把数组分为两部分Sa和Sb。Sa中的元素大于等于X,Sb中元素小于X。这时有两种情况:
           1. Sa中元素的个数小于k,则Sb中的第k-|Sa|个元素即为第k大数;
           2. Sa中元素的个数大于等于k,则返回Sa中的第k大数。时间复杂度近似为O(n)
      解法4: 二分[Smin,Smax]查找结果X,统计X在数组中出现,且整个数组中比X大的数目为k-1的数即为第k大数。时间复杂度平均情况为O(n*logn)

### 关于求解第K大数算法 #### 排序法 一种简单的方法是对整个数组进行排序,之后直接访问索引为 \(n-k\) 的位置获取第 \(k\) 大的数值[^1]。这种方法虽然直观易懂,但是由于涉及到全量数据排序操作,因此整体的时间复杂度较高。 #### 快速选择 (Quickselect) 基于快速排序改进而来的快速选择算法能够在平均情况下达到线性时间复杂度 O(n)[^3]。该算法通过随机选取一个元素作为枢纽,并以此划分序列;如果枢纽的位置正好等于目标位置,则返回此值;否则根据比较结果决定继续处理左半部分还是右半部分的数据集。这种策略有效地减少了不必要的计算开销。 ```cpp // C++ 实现 QuickSelect 查第 K 小元素 int partition(std::vector<int>& nums, int left, int right) { std::uniform_int_distribution<> dis(left, right); auto pivotIndex = dis(rng); // 随机选枢轴 swap(nums[pivotIndex], nums[right]); int storeIndex = left; for (size_t i = left; i < right; ++i) { if (nums[i] < nums[right]) { swap(nums[storeIndex++], nums[i]); } } swap(nums[right], nums[storeIndex]); return storeIndex; } int quickSelect(std::vector<int>& nums, int l, int r, int index) { while(true){ if(l==r) return nums[l]; int q = partition(nums,l,r); if(q == index) return nums[q]; else if(index<q) r=q-1; else l=q+1; } } ``` 为了到第 `K` 大的数字,在调用上述函数时传入参数 `(l=0, r=n-1, index=n-K)` 即可获得所需的结果。 #### 堆排序/优先队列 利用最大堆结构也可以高效解决此类问题。具体做法是先建立一个小顶堆维护前 k 个较大的元素,遍历剩余项并更新堆内成员直至结束。最终堆顶即为目标答案之一[^4]。这种方式特别适合用于流式输入场景下的实时查询需求。 ```python import heapq def find_kth_largest(nums, k): min_heap = [] for num in nums[:k]: heapq.heappush(min_heap, num) for num in nums[k:]: if num > min_heap[0]: heapq.heapreplace(min_heap, num) return min_heap[0] ``` 以上三种方式各有优劣,实际应用中可根据具体情况选用最适合的一种或组合多种技术共同解决问题。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值