求众数

这篇博客探讨了如何在数组中找到众数,即出现次数超过数组大小一半的元素。提出了两种方法:暴力解决法和哈希表法。暴力解决法通过两层循环统计每个数字的出现次数,时间复杂度为O(n²);而哈希表法利用哈希表在一次线性遍历中统计,时间复杂度降低到O(n),空间复杂度为O(n)。

给定一个大小为 n 的数组,找到其中的众数。众数是指在数组中出现次数大于 ⌊ n/2 ⌋ 的元素。

你可以假设数组是非空的,并且给定的数组总是存在众数。

例子
输入:[3,2,3]
输出:3
输入:[2,3,4,5,4]
输出:4

方法一:暴力解决法

遍历整个数组,同时统计每个数字出现的次数。

最后将出现次数大于一半的元素返回即可。

class Solution {
    public int majorityElement(int[] nums) {
        int majorityCount = nums.length/2;

        for (int num : nums) {
            int count = 0;
            for (int elem : nums) {
                if (elem == num) {
                    count += 1;
                }
            }

            if (count > majorityCount) {
                return num;
            }

        }

        return -1;    
    }
}

复杂度分析

  • 时间复杂度O(n²),暴力算法包含两重嵌套的for循环,每一层n次迭代,所以总的是平法级的时间复杂度
  • 空间复杂度O(1),暴力方法没有分配与输入规模成比例的额外的空间

方法二:哈希表

想法
我们知道出现次数最多的元素大于 n/2 次,所以可以用哈希表来快速统计每个元素出现的次数
算法
用哈希表来存储每个元素,然后用一个循环在线性时间内遍历nums,只需要返回有最大值的数

class Solution {
    private Map<Integer, Integer> countNums(int[] nums) {
        Map<Integer, Integer> counts = new HashMap<Integer, Integer>();
        for (int num : nums) {
            if (!counts.containsKey(num)) {
                counts.put(num, 1);
            }
            else {
                counts.put(num, counts.get(num)+1);
            }
        }
        return counts;
    }

    public int majorityElement(int[] nums) {
        Map<Integer, Integer> counts = countNums(nums);

        Map.E***y<Integer, Integer> majorityE***y = null;
        for (Map.E***y<Integer, Integer> e***y : counts.e***ySet()) {
            if (majorityE***y == null || e***y.getValue() > majorityE***y.getValue()) {
                majorityE***y = e***y;
            }
        }

        return majorityE***y.getKey();
    }
}

复杂度分析

  • 时间复杂度:O(n),我们将nums迭代一次,哈希表的插入时常数时间的。所以总时间复杂度为O(n)时间的。
  • 空间复杂度O(n),哈希表最多包含 n-n/2 个关系,所以占用的空间为O(n)。是因为任意一个长度为 nn 的数组最多只能包含 n 个不同的值,但题中保证 nums 一定有一个众数,会占用(最少)n/2+1个数字。因此最多有n-(n/2+1)个不同的数字,所以最多有n-n/2个不同的元素
在 pandas 库中,有多种众数的方法: 1. **按列获取众数**:从 `pandas.DataFrame` 调用 `mode()` 方法,返回一个 `pandas.DataFrame`,其元素默认为每一列的众数值。即使只有一种模式,也会返回一行的 `pandas.DataFrame` [^1]。 ```python import pandas as pd # 示例数据框 df = pd.DataFrame({'col1': [1, 2, 2, 3], 'col2': [4, 4, 5, 6]}) print(df.mode()) ``` 2. **对 `dataframe` 进行 `groupby` 后众数**:使用 `pd.Series.mode()` 函数,该函数返回 `Series` 的众数,当众数有多个时,会返回一个 `list`,里面包含了所有众数 [^2]。 ```python import pandas as pd df = pd.DataFrame({'a': ['A', 'A', 'B', 'B'], 'b': [1, 1, 2, 3]}) print(df.groupby('a').agg(pd.Series.mode).reset_index()) ``` 3. **行列众数及按列去重**:可以通过 `mode()` 方法众数,通过指定 `axis=1` 特定列的行众数 [^3]。 ```python import pandas as pd df2 = pd.DataFrame(data={'A': [1, 2, 3, 3, 4, 4, 4, 4], 'B': ['a', 'b', 'c', 'c', 'd', 'd', 'd', 'd'], 'C': [11, 22, 33, 33, 44, 44, 44, 44], 'D': [11, 22, 33, 33, 44, 44, 44, 44]}) print(df2.mode()) # 众数 print(df2.loc[:, ['A', 'C', 'D']].mode(axis=1)) # 特定列的行众数 ``` 4. **统计数值型数据的众数出现的频数**:先将数值型数据转换成类别型数据,然后用 `describe()` 进行统计,类型转换用 `astype()` 实现 [^4]。 ```python import pandas as pd detail = pd.read_excel('./meal_order_detail.xlsx', sep=',', encoding='gbk') detail['amounts'] = detail['amounts'].astype('category') print(detail['amounts'].describe()) ```
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值