作者:禅与计算机程序设计艺术
1.简介
Pandas 是 Python 中一个强大的、高级的数据分析工具。它拥有完善的统计、数据处理、合并、重塑等功能,可以说是目前最流行的数据分析库了。在本章节中,我将详细讲解 pandas 的一些高级用法,主要包括以下内容:
- Data Selection and Filtering
- Data Aggregation and Grouping
- Missing Value Handling
- Categorical Variable Handling
- Time-Series Analysis
在阅读本文之前,建议读者对 Pandas 有一定的基础认识。如果你不熟悉 Pandas ,建议先阅读《Python数据科学手册》的相关章节。
2.Data Selection and Filtering
2.1 Series 数据选择
通过索引方式获取 DataFrame 中的数据,是最简单的方法。但是,如果需要按照条件进行数据过滤,比如只选择某些列、或者满足一定条件的行,该怎么办呢?这就涉及到 Series 和 DataFrame 的选择操作了。
2.1.1 列选择
如果要选择 DataF