AcWing 52. 数组中出现次数超过一半的数字(基于中位数和众数的线性复杂度的解法)

本文介绍两种在线性复杂度内找到数组中出现超过一半的数字的算法,一种基于快速排序的轴点选择,另一种基于统计的众数算法。前者通过递归划分数组,后者通过遍历数组并维护出现次数最多的数。

 这道题最直观的解法就是使用排序算法将数组变为一个有序数组。显然,满足题意的数字必然是此时数组的中位数。但是,我们仍然清楚,即使是最快的排序算法,复杂度也不能低于O(nlogn)。不过,以下两个方法都可以在线性复杂度内解决此问题。

1.基于快速排序的轴点选择函数的算法(中位数)

快速排序的轴点选择函数会将序列中小于轴点值的数值放置到轴点左侧,大于等于轴点值的数值放置到轴点右侧。我们令每一次划分后都返回轴点所在的位置。如果说这个轴点的位置恰好为中位数,则直接输出。如果在轴点位置在中位数左侧则说明目标数值不可能出现在轴点位置左侧,需要对右侧部分重新进行划分。轴点位置在中位数右侧则同理对左侧部分重新进行划分。直至轴点位置恰好为中位数的位置。

具体代码如下:

class Solution {
public:
    int partition(vector<int> &nums, int lo, int hi){
        int i = lo, j = hi;
        while(i < j){
            while(nums[i] < nums[lo]) i++;
            while(nums[j] >= nums[lo]) j--;
            if(i < j) swap(nums[i], nums[j]);
        }
        swap(nums[i], nums[lo]);
        return i;
    }

    int moreThanHalfNum_Solution(vector<int>& nums) {
        int lo = 0, hi = nums.size() - 1;
        int mid = nums.size() >> 1;
        int index = partition(nums, lo, hi);
        while(index != mid){
            if(index > mid){
                hi = index - 1;
                index = partition(nums, lo, hi);
            }
            else{
                lo = index + 1;
                index = partition(nums, lo, hi);
            }
        }
        return nums[mid];
    }
};

此算法的时间复杂度为O(n),空间复杂度为O(1)。另外,此算法会改变原数组。

2.基于统计的算法(众数)

可以发现,满足条件的数字同时也是所有数字中的众数。那么我们可以统计数字的出现次数从而决定哪个数字是符合题意的。当然,这是最原始的方法。然而很多人不愿意使用的原因在于,为了做出相应的统计需要额外开辟空间用来记录。同时哈希表自身的查找也要耗费可观的时间。

不过,我们没有必要统计所有数的出现次数。因为我们要找的是出现次数最多的那个数,因此可以采取如下的方法。

首先我们维护两个变量,一个用来存放当前已遍历序列中出现次数最多的数,另一个用来记录这个数值相对于其他已遍历数值多出的出现次数。对于每一个当前扫描到的数,如果其值等于维护的数值则次数加1,反之则减1。当次数变为0时则将当前数字替换为新的维护数字。这样直至遍历结束,最后一个令次数记为1的数字就是最终结果。

具体代码如下:

class Solution {
public:
    int moreThanHalfNum_Solution(vector<int>& nums) {
        int ans = nums[0], count = 1;
        for(int i = 0; i < nums.size(); i++){
            if(ans == nums[i]) count++;
            else{
                count--;
                if(!count){
                    ans = nums[i];
                    count = 1;
                }
            }
        }
        return ans;
    }
};

此算法的时间复杂度为O(n),空间复杂度为O(1)。另外,此算法不会改变原数组。

给定含有n个元素的多重集合S,每个元素在S中出现的次数称为该元素的重数。多重集S中重数最大的元素称为众数。例如,S={1,2,2,2,3,5}。多重集S的众数是2,其重数为3。求众数方法很多,现要求你用分治算法来试一试,并分析其效率。 编程任务:对于给定的由n个自然数组成的多重集S,采用分治算法编程计算S的众数及其重数。 输入格式: 第1行多重集S中元素个数n;接下来的一行为集合S,有n个自然数。( n < 1000000 ) 输出格式: 结果输出:输出2个数,第1个数为众数,第2个为其重数。当有多个同样重数的众数,优先输出数值更小的数的众数。 输入样例: 6 1 2 2 2 3 5 输出样例: 2 3 提示 此题求众数,若数据规模n较小,则较为简单,解法较多。此题要求你用方法四,分治算法来实现。 解法一:(简单映射的解法) 用一个长度为最大元素值的数组作为n个元素出现重数的计数。这种方法时间复杂度为O(n),但空间复杂度较大些,空间依赖于原数组的规模。 解法二:(散列表映射的解法) 同解法一,只是采用散列表代替数组的映射,当散列表的负载因子小于0.5时,大部分情况下检索长度小于2,但若负载因子超过0.5,散列表性能也将下降。 解法三:(排序法) 将n个元素排序,相同元素将出现到一起,对排序后的数组从左到右一遍扫描,边扫描边统计,即可以找出具有最长相同元素序列的众数。此方法由于要排序,时间复杂度做不到线性,需要O(nlogn)。空间上需求较少,除了原数组外,只需要记录从左扫过来的当前出现最多的元素当前出现最多元素出现的次数,可以认为空间需求O(1)解法四:(分治算法) 1,先求n个元素的中位数及其位置(可以用书本上随机基准元素的快速选择算法实现中位数选择),然后以中位数做划分,划分出:比中位数小(含另外相等中位数分散在左段其间)的左段中位数大(含另外相等中位数分散在右段其间)的右段,此时要把数组中位数相同的数字靠拢,才可以统计中位数个数(中位数因相同可能存在多个),要聚拢选择出的中位数相等的其他分散在左段或右段中的其它中位数,还需对左段右段一遍扫描,将左段中最大元素往序列中间调(右调),右段中最小元素往序列中间调(左调),这样聚拢中位数,并得到聚拢后中位数的个数; 2,此时数组被中间相等的中位数分开成两部分,此时有递归的条件了: 先看左边,若中位数的个数比左边这段短,说明左边可能找到重数更多的,所以对左边段的递归继续;反之,如果左边这段的长度更短,就没有必要对左段继续递归。对右边那段数据采用同样的递归策略。当左右段都找到同样重数(都大于中间中位数个数,且重数相等),优先输出左段的众数。 时间效率分析:因为递归的两个子段都能以接近1/2倍率缩短,最坏情况下左右两段都要递归,所以T(n)=2T(n/2)+O(n) T(1)=1,因此T(n)=O(nlogn)。特别的,当中位数是主元素时(元素个数大于等于1/2的元素称为主元素),只需要O(n),一般情况下整个算法应该是介于O(n)O(nlogn)之间。空间上,除了原数组以外无需太多辅助的空间。 以上方法,方法4在实现上比方法3麻烦很多,但效率上方法4略好于方法3,方法4的最坏情况基本同于方法3。请帮我写代码
最新发布
10-23
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值