pandas 计数value_counts()

本文介绍Pandas中value_counts方法的使用技巧,包括参数详解及如何统计字段中各值出现的频次,并提供排序、百分比显示等功能。
在pandas里面常用用value_counts统计某个字段各种值数据出现的频率

pandas.Series.value_counts
Series.value_counts(normalize=False, sort=True, ascending=False, bins=None, dropna=True)


参数:
normalize : boolean, default False 如果设置为true,则以百分比的形式显示
sort : boolean, default True 是否排序
ascending : boolean, default False 默认降序排序
bins : integer, optional 而不是数值计算,把它们分成半开放的箱子,一个方便的pd.cut,只适用于数字数据
dropna : boolean, default True 默认删除na值
在数据分析过程中,统计某一列中各个值出现的频率是常见需求,Pandas库的`value_counts`方法能高效完成这一任务 [^1]。 ### 功能介绍 `value_counts`方法用于统计Pandas Series中各个唯一值出现的频数,返回一个新的Series,其中索引为原Series中的唯一值,值为对应唯一值出现的次数。 ### 使用说明 - 基本语法:`Series.value_counts(normalize=False, sort=True, ascending=False, bins=None, dropna=True)` - `normalize`:布尔值,默认为`False`。若为`True`,则返回频率而非频数。 - `sort`:布尔值,默认为`True`。若为`True`,则结果按频数排序。 - `ascending`:布尔值,默认为`False`。若为`True`,则升序排序。 - `bins`:整数或区间索引,默认为`None`。若指定,会将数据分箱统计。 - `dropna`:布尔值,默认为`True`。若为`True`,则不包含缺失值的计数。 ### 示例代码 #### 统计Series中各值的频数 ```python import pandas as pd # 创建一个包含重复值的 Series data = pd.Series(['apple', 'banana', 'apple', 'orange', 'banana', 'apple']) # 使用 value_counts() 统计各个值出现的频率 value_counts = data.value_counts() print(value_counts) ``` #### 统计DataFrame某列中各值的频数 ```python import pandas as pd # 创建一个示例dataframe data = {'fruit': ['apple', 'banana', 'orange', 'apple', 'banana'], 'amount': ['15', '20', '16', '15', '20']} df = pd.DataFrame(data) # 计算fruit列的元素个数 fruit_count = df['fruit'].value_counts() print(fruit_count) ```
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值