《pandas库:Series与DataFrame的使用指南》
1. pandas库的数据结构概述
pandas库提供了两种重要的数据结构:Series和DataFrame。Series用于处理一维数据,而DataFrame则用于处理多维数据。尽管它们并非能解决所有问题,但对于大多数应用场景而言,它们是非常有效且强大的工具。这两种数据结构简单易懂,许多复杂的数据结构都可以追溯到这两种基本形式。其独特之处在于结构中集成了Index对象和Labels,这使得数据结构具有很高的可操作性。
2. Series数据结构
2.1 Series的声明
Series是pandas库中用于表示一维数据结构的对象,类似于数组,但具有一些额外的特性。它的内部结构由两个相互关联的数组组成,主数组用于存储数据(可以是任何NumPy类型的数据),每个元素都与另一个数组(称为Index)中的标签相关联。
声明一个Series非常简单,只需调用 Series()
构造函数,并传入一个包含要包含的值的数组作为参数。
import pandas as pd
s = pd.Series([12, -4, 7, 9])
print(s)
输出结果:
0 12
1 -4
2 7
3 9
dtype: int64
如果在定义Series时未指定任何索引,pandas默认会将从0开始递增