数据处理中的索引对齐与分组聚合技巧
在数据处理和分析中,索引对齐和分组聚合是两个重要的操作。下面将详细介绍这两方面的内容及相关操作方法。
1. 索引对齐相关操作
索引对齐在数据处理中起着关键作用,我们可以通过一系列操作来实现特定的目标。
1.1 高亮每行最大值
默认情况下, highlight_max 方法会高亮每列的最大值。我们可以使用 axis 参数来高亮每行的最大值。以下是具体操作步骤:
import pandas as pd
# 读取数据集
college = pd.read_csv('data/college.csv', index_col='INSTNM')
# 选择种族百分比列
college_ugds = college.filter(like='UGDS_').head()
# 高亮每行中种族百分比最高的种族
college_ugds.style.highlight_max(axis='columns')
需要注意的是,对大型 DataFrame 应用样式可能会导致 Jupyter 崩溃,因此这里只对数据集的前几行应用了样式。
1.2 用方法链复制 idxmax 功能
尝试自己实现 DataFrame 的内置方法是一个很好的练习,可以让我们更深入地理解 pandas 方法。以下是复制 idxmax 功能的具体步骤:
1. 加载数据集并处理数据
超级会员免费看
订阅专栏 解锁全文
388

被折叠的 条评论
为什么被折叠?



