AcWing 52. 数组中出现次数超过一半的数字(基于中位数和众数的线性复杂度的解法)

本文介绍两种在线性复杂度内找到数组中出现超过一半的数字的算法,一种基于快速排序的轴点选择,另一种基于统计的众数算法。前者通过递归划分数组,后者通过遍历数组并维护出现次数最多的数。

 这道题最直观的解法就是使用排序算法将数组变为一个有序数组。显然,满足题意的数字必然是此时数组的中位数。但是,我们仍然清楚,即使是最快的排序算法,复杂度也不能低于O(nlogn)。不过,以下两个方法都可以在线性复杂度内解决此问题。

1.基于快速排序的轴点选择函数的算法(中位数)

快速排序的轴点选择函数会将序列中小于轴点值的数值放置到轴点左侧,大于等于轴点值的数值放置到轴点右侧。我们令每一次划分后都返回轴点所在的位置。如果说这个轴点的位置恰好为中位数,则直接输出。如果在轴点位置在中位数左侧则说明目标数值不可能出现在轴点位置左侧,需要对右侧部分重新进行划分。轴点位置在中位数右侧则同理对左侧部分重新进行划分。直至轴点位置恰好为中位数的位置。

具体代码如下:

class Solution {
public:
    int partition(vector<int> &nums, int lo, int hi){
        int i = lo, j = hi;
        while(i < j){
            while(nums[i] < nums[lo]) i++;
            while(nums[j] >= nums[lo]) j--;
            if(i < j) swap(nums[i], nums[j]);
        }
        swap(nums[i], nums[lo]);
        return i;
    }

    int moreThanHalfNum_Solution(vector<int>& nums) {
        int lo = 0, hi = nums.size() - 1;
        int mid = nums.size() >> 1;
        int index = partition(nums, lo, hi);
        while(index != mid){
            if(index > mid){
                hi = index - 1;
                index = partition(nums, lo, hi);
            }
            else{
                lo = index + 1;
                index = partition(nums, lo, hi);
            }
        }
        return nums[mid];
    }
};

此算法的时间复杂度为O(n),空间复杂度为O(1)。另外,此算法会改变原数组。

2.基于统计的算法(众数)

可以发现,满足条件的数字同时也是所有数字中的众数。那么我们可以统计数字的出现次数从而决定哪个数字是符合题意的。当然,这是最原始的方法。然而很多人不愿意使用的原因在于,为了做出相应的统计需要额外开辟空间用来记录。同时哈希表自身的查找也要耗费可观的时间。

不过,我们没有必要统计所有数的出现次数。因为我们要找的是出现次数最多的那个数,因此可以采取如下的方法。

首先我们维护两个变量,一个用来存放当前已遍历序列中出现次数最多的数,另一个用来记录这个数值相对于其他已遍历数值多出的出现次数。对于每一个当前扫描到的数,如果其值等于维护的数值则次数加1,反之则减1。当次数变为0时则将当前数字替换为新的维护数字。这样直至遍历结束,最后一个令次数记为1的数字就是最终结果。

具体代码如下:

class Solution {
public:
    int moreThanHalfNum_Solution(vector<int>& nums) {
        int ans = nums[0], count = 1;
        for(int i = 0; i < nums.size(); i++){
            if(ans == nums[i]) count++;
            else{
                count--;
                if(!count){
                    ans = nums[i];
                    count = 1;
                }
            }
        }
        return ans;
    }
};

此算法的时间复杂度为O(n),空间复杂度为O(1)。另外,此算法不会改变原数组。

给定含有n个元素的多重集合S,每个元素在S中出现的次数称为该元素的重数。多重集S中重数最大的元素称为众数。例如,S={1,2,2,2,3,5}。多重集S的众数是2,其重数为3。求众数方法很多,现要求你用分治算法来试一试,并分析其效率。 编程任务:对于给定的由n个自然数组成的多重集S,采用分治算法编程计算S的众数及其重数。 输入格式: 第1行多重集S中元素个数n;接下来的一行为集合S,有n个自然数。( n < 1000000 ) 输出格式: 结果输出:输出2个数,第1个数为众数,第2个为其重数。当有多个同样重数的众数,优先输出数值更小的数的众数。 输入样例: 6 1 2 2 2 3 5 输出样例: 2 3 提示 此题求众数,若数据规模n较小,则较为简单,解法较多。此题要求你用方法四,分治算法来实现。 解法一:(简单映射的解法) 用一个长度为最大元素值的数组作为n个元素出现重数的计数。这种方法时间复杂度为O(n),但空间复杂度较大些,空间依赖于原数组的规模。 解法二:(散列表映射的解法) 同解法一,只是采用散列表代替数组的映射,当散列表的负载因子小于0.5时,大部分情况下检索长度小于2,但若负载因子超过0.5,散列表性能也将下降。 解法三:(排序法) 将n个元素排序,相同元素将出现到一起,对排序后的数组从左到右一遍扫描,边扫描边统计,即可以找出具有最长相同元素序列的众数。此方法由于要排序,时间复杂度做不到线性,需要O(nlogn)。空间上需求较少,除了原数组外,只需要记录从左扫过来的当前出现最多的元素当前出现最多元素出现的次数,可以认为空间需求O(1)解法四:(分治算法) 1,先求n个元素的中位数及其位置(可以用书本上随机基准元素的快速选择算法实现中位数选择),然后以中位数做划分,划分出:比中位数小(含另外相等中位数分散在左段其间)的左段中位数大(含另外相等中位数分散在右段其间)的右段,此时要把数组中位数相同的数字靠拢,才可以统计中位数个数(中位数因相同可能存在多个),要聚拢选择出的中位数相等的其他分散在左段或右段中的其它中位数,还需对左段右段一遍扫描,将左段中最大元素往序列中间调(右调),右段中最小元素往序列中间调(左调),这样聚拢中位数,并得到聚拢后中位数的个数; 2,此时数组被中间相等的中位数分开成两部分,此时有递归的条件了: 先看左边,若中位数的个数比左边这段短,说明左边可能找到重数更多的,所以对左边段的递归继续;反之,如果左边这段的长度更短,就没有必要对左段继续递归。对右边那段数据采用同样的递归策略。当左右段都找到同样重数(都大于中间中位数个数,且重数相等),优先输出左段的众数。 时间效率分析:因为递归的两个子段都能以接近1/2倍率缩短,最坏情况下左右两段都要递归,所以T(n)=2T(n/2)+O(n) T(1)=1,因此T(n)=O(nlogn)。特别的,当中位数是主元素时(元素个数大于等于1/2的元素称为主元素),只需要O(n),一般情况下整个算法应该是介于O(n)O(nlogn)之间。空间上,除了原数组以外无需太多辅助的空间。 以上方法,方法4在实现上比方法3麻烦很多,但效率上方法4略好于方法3,方法4的最坏情况基本同于方法3。请帮我写代码
最新发布
10-23
<think>好的,我现在需要帮助用户找到力扣上关于“数组中出现次数超过一半数字”的相关题目。首先,根据用户提供的引用内容,特别是引用[1]到[5],可以看出用户主要关注的是剑指 Offer 39题,也就是多数元素问题。用户可能希望了解这道题的具体内容、解题思路以及相关方法。 首先,我需要确认用户提到的题目在力扣上的具体编号名称。根据引用[1]、[2]、[3]、[4][5],都指向了同一道题:剑指 Offer 39. 数组中出现次数超过一半数字。因此,我应该首先明确这道题的基本要求示例。 接下来,用户可能需要了解不同的解题方法,比如哈希表统计法、排序法、摩尔投票法等。根据引用[3][4]提到的摩尔投票法,这种方法的时间复杂度是O(n),空间复杂度是O(1),是一个高效的解法。需要详细解释摩尔投票法的原理,比如票数正负抵消的机制,以及如何通过遍历数组找到众数。 然后,用户可能需要了解其他相关题目,比如力扣中的第169题“多数元素”,这剑指Offer 39题类似,但可能有不同的输入条件或变种问题。此外,用户可能对类似的问题感兴趣,比如“求众数II”(第229题),需要找出出现次数超过n/3次的元素,这可以扩展用户的理解。 在整理回答时,需要确保符合用户给出的系统级指令,例如所有数学表达式用$...$格式,独立公式用$$...$$,并且正确使用中文。同时,生成相关问题时要考虑用户可能的后续疑问,比如不同解法的比较、时间空间复杂度分析、实际应用场景等。 需要验证引用的正确性,确保引用的内容对应的题目一致。例如,引用[3]提到的推论二关于票数的抵消机制,这确实是摩尔投票法的核心思想,需要正确引用。同时,代码示例需要符合用户提供的Python语法,并确保正确性。 最后,生成的相关问题需要覆盖用户可能感兴趣的方向,如其他相关题目、优化方法、实际应用等,确保问题具有引导性,帮助用户深入理解该算法题的不同方面。</think>### 数组中出现次数超过一半数字(剑指 Offer 39) #### 题目描述 数组中有一个数字出现的次数超过数组长度的一半,请找出这个数字。假设数组非空且总存在多数元素。 示例: 输入:`[1,2,3,2,2,2,5,4,2]` 输出:`2`(出现5次,数组长度9) --- #### 核心思路 1. **摩尔投票法** 通过**票数正负抵消**的思想,假设众数(出现次数超半数的数)的票数为$+1$,非众数的票数为$-1$。由于众数数量占优,最终剩余的数字必为众数[^3][^4]。 **步骤**: - 初始化候选值`x`票数`votes` - 遍历数组:若票数为0,更新候选值为当前元素;否则根据当前元素是否等于候选值增减票数 - 最终候选值即为众数 ```python def majorityElement(nums): votes, x = 0, None for num in nums: if votes == 0: x = num votes += 1 if num == x else -1 return x ``` 2. **其他解法** - **哈希统计法**:统计频率,时间复杂度$O(n)$,空间复杂度$O(n)$ - **排序法**:排序后取中间值,时间复杂度$O(n \log n)$,空间复杂度$O(1)$ --- #### 相关题目 1. **力扣169. 多数元素** 本题完全相同,可用相同解法[^2][^5]。 2. **力扣229.众数II** 扩展问题:找出所有出现次数超过$\lfloor n/3 \rfloor$次的元素,需结合摩尔投票法改进[^1]。 ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值