value_counts计算DataFrame,Series的数据频率

最新推荐文章于 2025-09-21 09:56:19 发布

原创最新推荐文章于 2025-09-21 09:56:19 发布 · 3.7w 阅读

30 ·

CC 4.0 BY-SA版权

机器学习专栏收录该内容

5 篇文章

订阅专栏

本文介绍了如何使用Python的Pandas库中的value_counts方法来计算数据集中各元素的出现频率。通过具体的Series和DataFrame示例展示了value_counts在单列和多列数据上的应用。

部署运行你感兴趣的模型镜像

在pandas里面常用用value_counts确认数据出现的频率。

Series 情况下

import numpy as np
import pandas as pd
from pandas import DataFrame
from pandas import Series
ss = Series(['Tokyo', 'Nagoya', 'Nagoya', 'Osaka', 'Tokyo', 'Tokyo'])   
ss.value_counts()   #value_counts 直接用来计算series里面相同数据出现的频率

Tokyo     3
Nagoya    2
Osaka     1
dtype: int64

DataFrame 情况下

import numpy as np
import pandas as pd
from pandas import DataFrame
from pandas import Series
df=DataFrame({'a':['Tokyo','Osaka','Nagoya','Osaka','Tokyo','Tokyo'],'b':['Osaka','Osaka','Osaka','Tokyo','Tokyo','Tokyo']})       #DataFrame用来输入两列数据，同时value_counts将每列中相同的数据频率计算出来
print(df)

       a      b
0   Tokyo  Osaka
1   Osaka  Osaka
2  Nagoya  Osaka
3   Osaka  Tokyo
4   Tokyo  Tokyo
5   Tokyo  Tokyo

df.apply(pd.value_counts) 
	a	b
Nagoya	1	NaN           #在b列中meiynagoya，因此是用NaN 表示。
Osaka	2	3.0
Tokyo	3	3.0

参考：

http://ailaby.com/dataframe_value_counts/

您可能感兴趣的与本文相关的镜像

Stable-Diffusion-3.5

图片生成

Stable-Diffusion

Stable Diffusion 3.5 (SD 3.5) 是由 Stability AI 推出的新一代文本到图像生成模型，相比 3.0 版本，它提升了图像质量、运行速度和硬件效率

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

大鱼霸吃小鱼儿

关注关注

6
点赞
踩
30

收藏

觉得还不错? 一键收藏
3
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

Pandas | value_counts() 的详细用法

小鱼干儿的博客

08-24

2万+

用来统计数据表中，指定列里有多少个不同的数据值，并计算每个不同值有在该列中的个数，同时还能根据指定得参数返回排序后结果。,这个的过程是先按‘label’分组然后再统计每组的值，这样的效率较低，不建议使用。数据标准化以后，所有得项得和为1（可能因为计算机存储数据而有误差）常用来计算各数据占的比例。默认统计个数并降序返回。同样的统计还可以使用。

【Pandas】pandas DataFrame value_counts

weixin_39648905的博客

05-26

1045

`pandas.DataFrame.value_counts()` 方法用于**统计 DataFrame 中每行的组合值出现的频率**，并返回按频率降序排列的结果。它是数据分析中非常有用的工具，尤其适用于分析多列组合的分布情况。

3 条评论您还未登录，请先登录后发表或查看评论

1 条评论

Viens_de_feng 2019.04.23
学到了

qq_42906197 2018.08.07
博主，请问一下怎么区分两种情况？
- gongel回复qq_42906197 2018.11.17
  总结就是两种value_counts(). 另外pd.value_counts()还可以统计一维数组.

Series.value_counts，pd.value_counts计算Series，DataFrame数据频率

小白tree的博客

02-03

4306

在pandas里面常用用value_counts确认数据出现的频率。一、对Series使用 ss = Series.values_count() 注意这里返回的就是Series In[2]: import numpy as np ...: import pandas as pd ...: from pandas import DataFrame ...: from pandas im...

pandas.DataFrame.value_counts

SmartDemo的博客

02-16

511

【代码】pandas.DataFrame.value_counts。

Excel VBA方法与属性全面掌握实战指南

weixin_42471823的博客

09-21

769

标准排序依赖默认的字母或数值顺序，但在某些业务场景下需要更灵活的规则。比如产品类别应按“黄金会员 > 白银会员 > 普通客户”排序，而非字典序。此时可通过自定义列表实现。Excel允许注册自定义排序序列，VBA可通过注册并引用：customList = Array("黄金会员", "白银会员", "普通客户", "潜在客户")' 添加自定义列表（仅需一次）CustomOrder:=3 ' 对应第3个自定义列表（索引从1开始）.ApplyEnd WithEnd Sub。

Pandas.DataFrame.value_counts() 频数/频数比详解含代码含测试数据集随Pandas版本持续更新

数象限

01-30

1962

本文基于 pandas2.2.0 编写。随着pandas的stable版本更迭，本文持续更新，不断完善补充。

python valuecount_Python pandas.DataFrame.value_counts函数方法的使用

weixin_39617702的博客

12-09

2022

DataFrame.value_counts(subset=None,normalize=False,sort=True,ascending=False)[source]返回一个包含DataFrame中唯一行数的Series。1.1.0版中的新功能。参数：subset：list-like, 可选计算唯一组合时要使用的列。normalize：bool, 默认为 False返回比例而不是频率。...

python 中的dataframe格式的数据value_counts()生成真正可以to_excel的数据

微信公众号（年更选手）：数据闲逛人 | Github开源项目：数分/数挖study路线 https://github.com/jc-dian/python_data_analysis

10-04

3417

bug来源我想统计下面的出现的次数进行汇总,但是后来想直接用value_counts()就可以了 ,但是这样后不能统计导出, 我想加个dataframe()总可以了吧, 但是还是不行 ,会报错 No engine for filetype: 我推测哪里肯定有索引看不到我一开始想着之前遇到过 ,以为与groupby遇到的bug一样 python中groupby

pandas计数 value_counts()的使用

09-19

其中一个常用的功能是 `value_counts()` 方法，它可以用来统计数据集中各个唯一值出现的次数。本文将详细介绍 `value_counts()` 方法的用法，并通过具体示例来帮助读者更好地理解和应用这一功能。 #### 1. Series ...

/Users/tansir/PycharmProjects/Python_study/离散化_分箱/基础数据分组.py:8: FutureWarning: pandas.value_counts is deprecated and will be removed in a future version. Use pd.Series(obj).value_counts() instead. print(pd.value_counts(cats))

07-10

如果 `pd.value_counts()` 已被标记为弃用，请始终使用 `Series.value_counts()` 或 `DataFrame.value_counts()` 来替代。 ```python # 替代方案 counts = data.value_counts() ``` ### 5. 检查第三方库的兼容性 ...

python valuecount_Python Pandas返回DataFrame,其中value count高于设定的数字

weixin_39876856的博客

12-09

409

我有一个Pandas DataFrame,我想仅在客户编号超过设定次数时才返回DataFrame.以下是DataFrame的示例：114 2017-04-26 1 7507 34 13115 2017-04-26 3 77314 41 14116 2017-04-27 7 4525 ...

value_counts()方法--Pandas

chongbaikaishi的博客

07-06

1239

返回DataFrame中值与计算组成的Series。

DataFrame.str.len()和DataFrame.value_counts()的用法

weixin_44865058的博客

04-18

424

这段代码的作用是，并统计每种长度的出现次数。

Python数据统计_pd.DataFrame各列数值统计

m0_55033759的博客

12-21

2303

Python数据统计，对pd.DataFrame各列数值统计

使用data.value_counts()方法对Series数组中的重复元素进行统计

weixin_41855010的博客

02-10

4476

类似于excel中的分类汇总，pandas库中为Series类的数据提供了.value_counts()方法，使用这种方法就可以完成重复元素的统计工作，这个方法将返回一个新的Series数组，这个数组的index是重复元素的内容（即原来数组中出现过的值），values中则存放着这个内容出现的次数。我们可以使用以下代码来进行演示： import pandas as pd import random ...

Pandas 系列之Series类型数据

尤尔小屋

04-28

2248

Pandas 系列之Series类型数据本文开始正式写Pandas的系列文章，就从：如何在Pandas中创建数据开始。Pandas中创建的数据包含两种类型： Series类型 DataFrame类型内容导图 Series类型 Series 是一维数组结构，它仅由index（索引）和value（值）构成的。 Series的索引具有唯一性，索引既可以是数字，也可以是字符，系统会自动将它们转成一个object类型（pandas中的字符类型）。 DataFrame类型 DataFrame 是将数个

pandas计数函数：value_counts( )和counts( )的使用