数据处理中的索引对齐与分组聚合技巧
1. 索引对齐相关操作
1.1 突出显示最大值
默认情况下, highlight_max 方法会突出显示每列的最大值。我们可以使用 axis 参数来突出显示每行的最大值。以下是一个示例,我们选择大学数据集中的种族百分比列,并突出显示每所学校中百分比最高的种族:
import pandas as pd
college = pd.read_csv('data/college.csv', index_col='INSTNM')
college_ugds = college.filter(like='UGDS_').head()
college_ugds.style.highlight_max(axis='columns')
需要注意的是,尝试对大型 DataFrame 应用样式可能会导致 Jupyter 崩溃,因此这里只对 DataFrame 的前几行应用了样式。
1.2 用方法链复制 idxmax 功能
手动实现内置的 DataFrame 方法是一个很好的练习,这可以让我们更深入地理解 Pandas 的其他方法。下面是通过一系列步骤来复制 idxmax 功能的过程:
1. 加载数据并筛选感兴趣的列 :
import numpy as np
college = pd.read_csv(
超级会员免费看
订阅专栏 解锁全文
388

被折叠的 条评论
为什么被折叠?



