数据处理与分析中的索引对齐和分组聚合
一、索引对齐相关操作
1.1 高亮每行最大值
默认情况下, highlight_max 方法会高亮每列的最大值。我们可以使用 axis 参数来高亮每行的最大值。以下是具体操作步骤:
1. 读取大学数据集,并选择种族百分比列:
import pandas as pd
college = pd.read_csv('data/college.csv', index_col='INSTNM')
college_ugds = college.filter(like='UGDS_').head()
- 高亮每行中种族百分比最高的种族:
college_ugds.style.highlight_max(axis='columns')
需要注意的是,对大型 DataFrame 应用样式可能会导致 Jupyter 崩溃,因此这里只对数据的前几行应用了样式。
1.2 用方法链复制 idxmax 方法
通过自己实现内置的 DataFrame 方法,可以更深入地理解其他 pandas 方法。下面是使用基本方法链来找到包含列最大值的所有行索引值的步骤:
1. 加载大学数据集并选择感兴趣的数值列:
im
超级会员免费看
订阅专栏 解锁全文
836

被折叠的 条评论
为什么被折叠?



