数据处理中的索引对齐与分组聚合操作
1. 索引对齐相关操作
在数据处理过程中,索引对齐是一个重要的操作。下面将介绍如何通过一系列方法找到包含列最大值的行索引。
1.1 高亮每行最大值
默认情况下, highlight_max 方法会高亮每列的最大值。我们可以使用 axis 参数来高亮每行的最大值。以下是具体代码:
import pandas as pd
college = pd.read_csv('data/college.csv', index_col='INSTNM')
college_ugds = college.filter(like='UGDS_').head()
college_ugds.style.highlight_max(axis='columns')
需要注意的是,对大型 DataFrame 应用样式可能会导致 Jupyter 崩溃,因此这里只对数据的前几行应用了样式。
1.2 手动实现 idxmax 方法
手动实现 idxmax 方法可以帮助我们更深入地理解 Pandas 的其他方法。以下是具体步骤:
1. 加载数据集并筛选感兴趣的数值列 :
import numpy as np
college = pd.read_csv('data/college.csv', index
超级会员免费看
订阅专栏 解锁全文
1296

被折叠的 条评论
为什么被折叠?



