数据处理与分析:基本操作与技巧
在数据处理和分析领域,掌握一些基本的操作和技巧是至关重要的。本文将围绕几个关键方面展开,包括DataFrame的基本操作、校园多样性的评估、数据的初步分析常规以及通过改变数据类型来减少内存使用等内容。
1. 计算累积和
使用 cumsum 方法可以对数据进行不同视角的分析。例如,对于校园种族数据,使用 axis=1 的 cumsum 方法可以累积每行的种族百分比,方便查看每个学校中白人、黑人和西班牙裔等种族的累计百分比。
college_ugds_cumsum = college_ugds_.cumsum(axis=1)
college_ugds_cumsum.head()
相关文档可参考 Pandas官方文档 。
2. 评估校园多样性
每年都有许多文章探讨校园多样性的不同方面和影响,不同组织也开发了各种指标来衡量多样性。美国新闻在大学排名方面处于领先地位,其中也包括多样性排名。
2.1 数据准备
校园数据集将种族分为九个不同类别。我们的多样性指标定义为学生人口中种族占比超过15%的种族数量。
2.2 操作步骤
- 读取数据并筛选列 :
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



