数据框操作与数据分析基础
1. 数据框累积求和操作
cumsum 方法结合 axis=1 可以对每行的种族百分比进行累积求和,这能从不同角度展示数据。例如,能轻松查看每所学校白种人、黑种人和西班牙裔人口的精确百分比总和。
college_ugds_cumsum = college_ugds_.cumsum(axis=1)
college_ugds_cumsum.head()
2. 确定大学校园多样性
每年都有许多文章探讨大学校园多样性的不同方面和影响,不同组织也开发了衡量多样性的指标。美国新闻在为各类大学提供排名方面处于领先地位,其中包括多样性排名。以下是获取美国新闻排名前 10 的多样化大学及其多样性指数的代码:
pd.read_csv('data/college_diversity.csv', index_col='School')
3. 计算多样性指标的步骤
- 读取数据并筛选列 :
college = pd.read_csv('data/college.csv', index_col='INSTNM')
college_ugds_ = college.filter(like='UGDS_')
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



