python中count()、values_counts()、size()函数

最新推荐文章于 2023-10-15 14:58:46 发布

转载最新推荐文章于 2023-10-15 14:58:46 发布 · 3.8k 阅读

16 篇文章

订阅专栏

count()函数之详解 https://blog.youkuaiyun.com/JNingWei/article/details/78308815

转载了count（）函数，以便自己以后更好的查阅。

str.count(sub, start= 0,end=len(string))

Args	Annotations
sub	搜索的子字符串
start	字符串开始搜索的位置。默认为第一个字符,第一个字符索引值为0。
end	字符串中结束搜索的位置。字符中第一个字符的索引为 0。默认为字符串的最后一个位置。

list.count(obj)

Args	Annotations
obj	搜索的list

# coding=utf-8
string = 'Hello World ! Hello Python !'
print "string.count(sub) : ", string.count('H')
print "string.count(sub, 1) : ", string.count('H', 1)
print "string.count(sub, 1, 100) : ", string.count('H', 1, 100) # 随便取个无限大的 end 参数

打印结果：

string.count(sub) :  2
string.count(sub, 1) :  1
string.count(sub, 1, 100) :  1

打印结果：

list.count('Hello') :  1
list.count(10) :  2

pandas 的value_counts()函数可以对Series里面的每个值进行计数并且排序。

现有一个DataFrame

如果我们想知道，每个区域出现了多少次，可以简单如下：

每个区域都被计数，并且默认从最高到最低做降序排列。

如果想用升序排列，可以加参数ascending=True：

如果想得出的计数占比，可以加参数normalize=True：

空值是默认剔除掉的。value_counts()返回的结果是一个Series数组，可以跟别的数组进行运算。

value_count()跟透视表里（pandas或者excel）的计数很相似，都是返回一组唯一值，并进行计数。这样能快速找出重复出现的值。

size()和shape () 是numpy模块中才有的函数

size()：计算数组和矩阵所有数据的个数
a = np.array([[1,2,3],[4,5,6]])
np.size(a)，返回值为 6
np.size(a,1)，返回值为 3

shape ():得到矩阵每维的大小
np. shape (a)，返回值为 (2,3)

另外要注意的是，shape和size既可以作为函数，也可以作为ndarray的属性
a.size，返回值为 6,
a.shape，返回值为 (2,3)