学习笔记(15):零基础搞定Python数据分析与挖掘-数据的汇总

本文详细介绍如何使用 Pandas 进行高效的数据分析,包括透视表、分组汇总、数据整理等核心操作,助您快速掌握数据处理技能。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

立即学习:https://edu.youkuaiyun.com/course/play/6861/326775?utm_source=blogtoedu

数据汇总

透视表

pd.pivot_table(data, values=None, index=None, columns=None, aggfunc='mean', fill_value=None, margins=False, dropna=True, margins_name='All')

data:数据集

values:要拉入数值的字段列表

index:要拉入行标签的字段列表

columns:要拉入列标签的字段列表

aggfunc:统计函数,默认统计均值

fill_value:填充缺失值

margins:是否显示行或列的总计值

dropna:是否删除整列为缺失的字段

margins_name:指定行或列的总计名称

 

分组汇总

groupby方法:用于汇总前,设定被分组的变量

要分组的数据集.groupby=(['变量1', '变量2'])

 

aggregate方法:可基于groupby的结果做进一步统计汇总

分组后的数据集.aggregate=({'变量':方法})

np.min np.max np.size np.mean......

 

调整变量名顺序

pd.DataFrame(数据集, columns=(['变量名1', '变量名2', '变量名3'])

 

对变量重新命名

 数据集.rename=(colums={'原变量名':'新变量名'}, inplace=True)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值