数据整理:将数据重构为整齐的格式
在数据处理和分析中,数据的整齐格式对于后续的操作和分析至关重要。本文将介绍几种常见的数据整理方法,包括使用 groupby 聚合复制 pivot_table 功能、重命名轴级别以方便数据重塑、处理列名包含多个变量的情况以及处理列值包含多个变量的情况。
1. 使用 groupby 聚合复制 pivot_table 功能
乍一看, pivot_table 方法似乎提供了一种独特的数据分析方式。然而,经过一些处理后,可以使用 groupby 聚合完全复制其功能。了解这种等价关系有助于缩小 pandas 功能的范围。
操作步骤 :
1. 读取航班数据集,并使用 pivot_table 方法查找每个航空公司每个出发机场的取消航班总数:
import pandas as pd
flights = pd.read_csv('data/flights.csv')
fp = flights.pivot_table(index='AIRLINE',
columns='ORG_AIR',
values='CANCELLED',
aggfunc='sum',
超级会员免费看
订阅专栏 解锁全文
1万+

被折叠的 条评论
为什么被折叠?



