python基础-numpy.bincount详解

最新推荐文章于 2024-11-24 11:39:52 发布

转载最新推荐文章于 2024-11-24 11:39:52 发布 · 7.4k 阅读

Python 专栏收录该内容

30 篇文章

订阅专栏

本文深入讲解了numpy.bincount函数的使用方法，包括基本概念、参数weights和minlength的应用，并通过实例帮助读者理解。

转载出处：numpy.bincount详解

引言

我一般不愿意去写关于api怎么用的博客，因为出api的官网已经很详细地介绍了它们api的作用。今天，我的一个同学问到我numpy.bincount这个的用法，当时我有些事情，我和他说你先去百度一下吧，自己先看看，如果实在不行了我忙完给你解释一下。当然了，我同学的英语水平不怎么好，它不会去查看英文文档，因此他只能看百度搜索出来的一些博客，但是，所有的文章基本相同，当然了，我不知道哪个篇文章是源头。而且，文章关于这个api的解释我不想多说了，本来会的都有可能给你看不会了（有点夸张了），有兴趣大家可以自己看看吧！

对于中国的编程人员来说，其实真的挺困难的。比如说，youtube上有很多优秀的一些资源 1、我们的网不能看2、我们的英语不够好，确实听不明白老外在讲什么，这个对于不是native speaker的人说，真的是很困难的。因此，我们中国的编程人员要比一个外国的编程人员克服的困难多很多。

因此，我的建议是如果大家有时间，还是要把英语练好。学好英语以后你会得到更加优秀的资源并能很好地吸收这些资源，你会少碰到一些困难。好了，闲话不说了，既然今天碰到了这个事情，我觉得还是应该把这个api写一下吧，尽自己的努力让一些初学者少走一些弯路。

numpy.bincount详解

下面，是我Zeal上的官方文档，我截图下来，我会按照这个文档一步一步给大家解释的。

numpy.bincount详解

它大致说bin的数量比x中的最大值大1，每个bin给出了它的索引值在x中出现的次数。下面，我举个例子让大家更好的理解一下：

# 我们可以看到x中最大的数为7，因此bin的数量为8，那么它的索引值为0->7
x = np.array([0, 1, 1, 3, 2, 1, 7])
# 索引0出现了1次，索引1出现了3次......索引5出现了0次......
np.bincount(x)
#因此，输出结果为：array([1, 3, 1, 1, 0, 0, 0, 1])

# 我们可以看到x中最大的数为7，因此bin的数量为8，那么它的索引值为0->7
x = np.array([7, 6, 2, 1, 4])
# 索引0出现了0次，索引1出现了1次......索引5出现了0次......
np.bincount(x)
#输出结果为：array([0, 1, 1, 0, 1, 0, 1, 1])
 1
2
3
4
5
6
7
8
9
10
11

下面，我来解释一下weights这个参数。文档说，如果weights参数被指定，那么x会被它加权，也就是说，如果值n发现在位置i，那么out[n] += weight[i]而不是out[n] += 1.因此，我们weights的大小必须与x相同，否则报错。下面，我举个例子让大家更好的理解一下：

w = np.array([0.3, 0.5, 0.2, 0.7, 1., -0.6])
# 我们可以看到x中最大的数为4，因此bin的数量为5，那么它的索引值为0->4
x = np.array([2, 1, 3, 4, 4, 3])
# 索引0 -> 0
# 索引1 -> w[1] = 0.5
# 索引2 -> w[0] = 0.3
# 索引3 -> w[2] + w[5] = 0.2 - 0.6 = -0.4
# 索引4 -> w[3] + w[4] = 0.7 + 1 = 1.7
np.bincount(x,  weights=w)
# 因此，输出结果为：array([ 0. ,  0.5,  0.3, -0.4,  1.7])
 1
2
3
4
5
6
7
8
9
10

最后，我们来看一下minlength这个参数。文档说，如果minlength被指定，那么输出数组中bin的数量至少为它指定的数（如果必要的话，bin的数量会更大，这取决于x）。下面，我举个例子让大家更好的理解一下：

# 我们可以看到x中最大的数为3，因此bin的数量为4，那么它的索引值为0->3
x = np.array([3, 2, 1, 3, 1])
# 本来bin的数量为4，现在我们指定了参数为7，因此现在bin的数量为7，所以现在它的索引值为0->6
np.bincount(x, minlength=7)
# 因此，输出结果为：array([0, 2, 1, 2, 0, 0, 0])

# 我们可以看到x中最大的数为3，因此bin的数量为4，那么它的索引值为0->3
x = np.array([3, 2, 1, 3, 1])
# 本来bin的数量为4，现在我们指定了参数为1，那么它指定的数量小于原本的数量，因此这个参数失去了作用，索引值还是0->3
np.bincount(x, minlength=1)
# 因此，输出结果为：array([0, 2, 1, 2])
 1
2
3
4
5
6
7
8
9
10
11