求众数

本文深入探讨Boyer-Moore投票算法,一种高效寻找数组中众数的方法。通过实例演示算法流程,解释其背后的逻辑,以及如何在PHP中实现该算法。

题目: 给定一个大小为 n 的数组,找到其中的众数。众数是指在数组中出现次数大于 ⌊ n/2 ⌋ 的元素。

你可以假设数组是非空的,并且给定的数组总是存在众数。

示例 1:

输入: [3,2,3]
输出: 3
示例 2:

输入: [2,2,1,1,1,2,2]
输出: 2

Boyer-Moore 投票算法
想法

如果我们把众数记为 +1+1 ,把其他数记为 -1−1 ,将它们全部加起来,显然和大于 0 ,从结果本身我们可以看出众数比其他数多。

算法

本质上, Boyer-Moore 算法就是找 nums 的一个后缀 sufsuf ,其中 suf[0]suf[0] 就是后缀中的众数。我们维护一个计数器,如果遇到一个我们目前的候选众数,就将计数器加一,否则减一。只要计数器等于 0 ,我们就将 nums 中之前访问的数字全部 忘记 ,并把下一个数字当做候选的众数。直观上这个算法不是特别明显为何是对的,我们先看下面这个例子(竖线用来划分每次计数器归零的情况)

[7, 7, 5, 7, 5, 1 | 5, 7 | 5, 5, 7, 7 | 7, 7, 7, 7]

首先,下标为 0 的 7 被当做众数的第一个候选。在下标为 5 处,计数器会变回0 。所以下标为 6 的 5 是下一个众数的候选者。由于这个例子中 7 是真正的众数,所以通过忽略掉前面的数字,我们忽略掉了同样多数目的众数和非众数。因此, 7 仍然是剩下数字中的众数。

[7, 7, 5, 7, 5, 1 | 5, 7 | 5, 5, 7, 7 | 5, 5, 5, 5]

现在,众数是 5 (在计数器归零的时候我们把候选从 7 变成了 5)。此时,我们的候选者并不是真正的众数,但是我们在 遗忘 前面的数字的时候,要去掉相同数目的众数和非众数(如果遗忘更多的非众数,会导致计数器变成负数)。

因此,上面的过程说明了我们可以放心地遗忘前面的数字,并继续求解剩下数字中的众数。最后,总有一个后缀满足计数器是大于 0 的,此时这个后缀的众数就是整个数组的众数。

function majorityElement2($nums)
{
    $candidate = $nums[0];
    $count = 1;
    for ($i = 1; $i < count($nums); ++$i) {
        ($nums[$i] != $candidate) ? ($count--) : ($count++);
        ($count == 0) && ($candidate = $nums[$i+1]);
    }
    return $candidate;
}
在 pandas 库中,有多种众数的方法: 1. **按列获取众数**:从 `pandas.DataFrame` 调用 `mode()` 方法,返回一个 `pandas.DataFrame`,其元素默认为每一列的众数值。即使只有一种模式,也会返回一行的 `pandas.DataFrame` [^1]。 ```python import pandas as pd # 示例数据框 df = pd.DataFrame({'col1': [1, 2, 2, 3], 'col2': [4, 4, 5, 6]}) print(df.mode()) ``` 2. **对 `dataframe` 进行 `groupby` 后众数**:使用 `pd.Series.mode()` 函数,该函数返回 `Series` 的众数,当众数有多个时,会返回一个 `list`,里面包含了所有众数 [^2]。 ```python import pandas as pd df = pd.DataFrame({'a': ['A', 'A', 'B', 'B'], 'b': [1, 1, 2, 3]}) print(df.groupby('a').agg(pd.Series.mode).reset_index()) ``` 3. **行列众数及按列去重**:可以通过 `mode()` 方法众数,通过指定 `axis=1` 特定列的行众数 [^3]。 ```python import pandas as pd df2 = pd.DataFrame(data={'A': [1, 2, 3, 3, 4, 4, 4, 4], 'B': ['a', 'b', 'c', 'c', 'd', 'd', 'd', 'd'], 'C': [11, 22, 33, 33, 44, 44, 44, 44], 'D': [11, 22, 33, 33, 44, 44, 44, 44]}) print(df2.mode()) # 众数 print(df2.loc[:, ['A', 'C', 'D']].mode(axis=1)) # 特定列的行众数 ``` 4. **统计数值型数据的众数出现的频数**:先将数值型数据转换成类别型数据,然后用 `describe()` 进行统计,类型转换用 `astype()` 实现 [^4]。 ```python import pandas as pd detail = pd.read_excel('./meal_order_detail.xlsx', sep=',', encoding='gbk') detail['amounts'] = detail['amounts'].astype('category') print(detail['amounts'].describe()) ```
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值