面向初学者的 Python Pandas - 完整指南(第 1 部分)
本系列文章Python Pandas for Beginner 将是初学者学习 pandas 库的最佳起点。您将学习一些最重要的 pandas 功能,例如探索、清理、转换和可视化数据。
Pandas是 Python 中的一个开源库。它是当今用于数据分析的最流行的 Python 库。强大的机器学习和可视化工具,它为您提供分析大数据集的高性能工具。
在这篇文章中,我们将介绍有关 pandas 的基本信息,从安装到优势。你应该给自己泡杯咖啡,拿你最喜欢的饼干。之后,慢慢享受和阅读这篇文章。随意停止并稍后继续,不要在短时间内被大量信息压倒。只要仔细一步一步,熊猫就会来找你。
你好熊猫
(熊猫 - 来源:壁纸播放)
什么是熊猫?
Pandas是一个用于分析、数据处理和数据科学的库。这是一个拥有 1,500 多名贡献者的大型开源项目。这是GitHub 上 Pandas项目的链接
安装
安装 Pandas 的最简单方法是使用 Anaconda 发行版。您还没有安装 Anaconda,请阅读我们的 Anaconda 安装指南帖子。
如果不想安装 Anaconda,可以通过 pip 安装。
<span style="color:var(--syntax-text-color)"><span style="color:var(--syntax-text-color)"><code>pip install pandas
</code></span></span>
Pandas 的数据结构
Pandas 的两个主要数据结构是Series
和DataFrame
。当我们加入多个系列(列)时, ASeries
只是一个列,所以我们有一个DataFrame
.
Pandas 中的 Series 和 DataFrame
创建您的系列和数据框
系列入门
首先,通过传递值列表来创建系列数据。Pandas 默认从 0 开始计算索引。
<span style="color:var(--syntax-text-color)"><span style="color:var(--syntax-text-color)"><code