数据整理:将数据重构为整洁形式
在数据分析过程中,数据的整理和重构是至关重要的环节。整洁的数据结构能够提高分析效率,使数据更易于理解和处理。本文将介绍几种常见的数据重构方法,包括使用 groupby 聚合复制 pivot_table 功能、重命名轴级别以方便重塑数据、处理列名包含多个变量的情况以及处理列值包含多个变量的情况。
1. 使用 groupby 聚合复制 pivot_table 功能
pivot_table 方法提供了一种独特的数据分析方式,但通过一些处理,也可以使用 groupby 聚合来精确复制其功能。
操作步骤 :
1. 读取航班数据集,并使用 pivot_table 方法找出每个航空公司在每个出发机场的取消航班总数:
import pandas as pd
flights = pd.read_csv('data/flights.csv')
fp = flights.pivot_table(index='AIRLINE',
columns='ORG_AIR',
values='CANCELLED',
aggfunc='sum',
fill_v
超级会员免费看
订阅专栏 解锁全文

15

被折叠的 条评论
为什么被折叠?



