numpy 统计数组每一行出现次数最多的数字

最新推荐文章于 2025-06-05 11:40:37 发布

原创最新推荐文章于 2025-06-05 11:40:37 发布 · 2.2w 阅读

6 ·

CC 4.0 BY-SA版权

Python 专栏收录该内容

11 篇文章

订阅专栏

本文介绍如何利用numpy库中的np.bincount()和np.argmax()函数来找出数组中出现频率最高的元素。通过两个DataFrame示例的拼接操作，并对结果应用统计方法，演示了如何获取出现次数最多的值。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

使用np.bincount()和np.argmax()函数来实现。

np.bincount()可以把数组中出现的每个数字，当做index，数字出现的次数当做value来表示。

np.argmax()可以返回数组中最大值的index。

所以经过变换，可以得到出现次数的最大值。

feature1 = pd.DataFrame({'id':[1, 2, 3, 4, 4, 6, 1, 2, 3], 'item1':[1, 2, 3, 4, 5, 6, 1, 2, 3], 'item2':[1, 2, 3, 4, 5, 6, 2, 7, 3]})
feature2 = pd.DataFrame({'id':[1, 3, 7, 4, 4, 6, 1, 2, 3], 'item1':[1, 2, 3, 4, 5, 6, 1, 2, 3], 'item2':[1, 2, 3, 4, 5, 6, 2, 7, 3]})
feature3 = np.concatenate((feature1, feature2),axis = 1)
print(feature3)
for line in feature3:
    print(np.argmax(np.bincount(line)))