以下是关于pandas数据结构部分的详细讲解和案例:
Series
Series是pandas中的一种一维数组结构,可以存储任意类型的数据(整数、字符串、浮点数、Python对象等),并且每个数据点都有一个对应的索引标签。
-
创建Series
- 案例:创建一个包含水果数量的Series对象。
- 代码:
import pandas as pd # 创建一个简单的Series fruit_counts = pd.Series([10, 20, 15, 30], index=['Apple', 'Banana', 'Cherry', 'Date']) # 查看Series print(fruit_counts)
- 输出:
Apple 10 Banana 20 Cherry 15 Date 30 dtype: int64
-
索引和操作Series
- 索引:可以通过标签或位置来索引Series中的数据。
# 通过标签索引 print(fruit_counts['Banana']) # 输出:20 # 通过位置索引 print(fruit_counts[1]) # 输出:20
- 操作:可以对Series进行各种运算和操作。
# 累加 print(fruit_counts.sum()) # 输出:75 # 过滤 print(fruit_counts[fruit_counts > 15]) # 输出:Banana 20, Date 30
- 索引:可以通过标签或位置来索引Series中的数据。
Series常用方法
创建和转换
pd.Series(data, index=index, dtype=dtype, name=name)
:创建一个新的Series对象。to_frame(name