【100天精通Python】Day60:Python 数据分析_Pandas高级功能-数据透视表pivot_table()和数据交叉表crosstab()常用功能和操作

本文深入探讨了Python数据分析库Pandas中的数据透视表pivot_table和交叉表crosstab的高级功能。讲解了如何自定义聚合函数、指定多个聚合函数、处理缺失值、更改行列顺序以及多层索引的重新排列。此外,还介绍了数据交叉表的计算频率表、百分比表、边际频率和加权计算等功能。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

目录

1 数据透视表和交叉表pivot_table(),crosstab()

2  Pandas数据透视表常用操作

2.1 自定义聚合函数

2.2 指定多个聚合函数

2.3 处理缺失值

2.4 更改行和列的顺序

2.5 重新排列多层索引

3 数据交叉表常用功能 

3.1 计算频率表

3.2 计算百分比表

3.3 使用 margins 参数计算边际频率

3.4 使用 values 参数进行加权计算

3.5 自定义聚合函


1 数据透视表和交叉表pivot_table(),crosstab()

  • 数据透视表:使用 pivot_table() 方法,你可以根据一个或多个列的值对数据进行汇总和分析。你可以指定哪些列作为索引,哪些列作为值,以及如何进行聚合计算。

  • 交叉表:使用 pd.crosstab() 函数,你可以计算两个或多个因素之间的交叉频率,特别适用于分类数据的汇总分析。

数据透视表和交叉表示例:

import pandas as pd

# 创建一个示例DataFrame
data = {'Category': ['A', 'B', 'A', 'B', 'A'],
        'Value1': [10, 15, 20, 25, 30],
        'Value2': [100, 150, 200, 250, 30
评论 9
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

LeapMay

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值