数据整理:将数据重构为整洁形式
在数据分析过程中,数据的整洁性至关重要。整洁的数据结构能够让分析工作更加高效、准确。本文将介绍几种常见的数据整理场景及相应的处理方法,包括使用 groupby 聚合复制 pivot_table 功能、重命名轴级别以方便数据重塑、处理列名包含多个变量的数据以及处理列值包含多个变量的数据。
1. 使用 groupby 聚合复制 pivot_table 功能
乍一看, pivot_table 方法似乎为数据分析提供了一种独特的方式。然而,经过一些处理后,可以使用 groupby 聚合完全复制其功能。这有助于缩小 pandas 功能的使用范围。
操作步骤 :
1. 读取航班数据集,并使用 pivot_table 方法查找每个航空公司每个出发机场的取消航班总数 :
import pandas as pd
flights = pd.read_csv('data/flights.csv')
fp = flights.pivot_table(index='AIRLINE',
columns='ORG_AIR',
values='CANCELLED',
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



