第6章 结构化数据分析工具Pandas
作为Python科学计算的基础软件包,NumPy已经足够强大,却不够完美,因为NumPy不支持异构列表格数据。异构列表格数据是指在一个二维数据结构中允许不同的列拥有不同的数据类型。尽管NumPy支持任意维度的数据结构,但在实际工作中,无论是传统软件开发领域还是机器学习领域,使用的数据大多数都是二维异构列表格数据。Pandas正是为处理此类数据而生的,它为处理和SQL或Excel表类似的异构列表格数据提供了灵活、便捷的数据结构,从而迅速成为Python 的核心数据分析支持库。
6.1 Pandas概览
Pandas是一个基于NumPy的分析结构化数据的工具集,NumPy为其提供了高性能的数据处理能力。Pandas被普遍用于数据挖掘和数据分析,同时也提供数据清洗、数据I/O、数据可视化等辅助功能。
6.1.1 安装和使用
Pandas可以使用pip命令直接安装,安装命令如下。如果默认的模块安装源下载速度慢,可以使用-i参数选择下载速度更快的清华、阿里、中科大等镜像源。
PS C:\Users\xufive> python -m pip install pandas
因为NumPy是Pandas的依赖包,如果当前系统没有安装NumPy,上面的安装命令还会自动安装最新版本的NumPy模块。类似导入NumPy模块时使用简写,导入Pandas模块时,pandas通常都会简写为pd,这几乎
《Python高手修炼之道》第六章深入介绍了Pandas,一个基于NumPy的数据分析工具,用于处理结构化数据。Pandas以简洁的接口提供了强大的数据结构DataFrame,支持数据预览、选择、转换和类型更改。章节涵盖了Pandas的安装、数据结构、基本操作,以及高级应用,包括数据分组、聚合、时间序列处理和数据可视化。此外,还提及了Pandas与其他工具如Statsmodels和Seaborn的集成,用于统计分析和图表绘制。
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



