pandas
专为解决数据分析任务的Python库\color{red}{专为解决数据分析任务的Python库}专为解决数据分析任务的Python库提供高性能数据类型和分析工具,基于NumPy实现。
NumPy | 基础数据类型 | 关注数据的结构表达 | 维度:数据间关系 |
---|---|---|---|
Pandas | 扩展数据类型 | 关注数据的应用表达 | 数据与索引间关系 |
- 导入库
import pandas as pd
pandas库有两个数据类型:Series,DataFrame
Series
Series类型是由一组数据及与之相关的数据索引组成,有两个重要的属性
- .values属性:数据,np.array类型
- .index属性:索引,pd.indexes类型
Series创建
# 标量值创建(python列表)
s = pd.Series(25,index=['a','b','c'])
# 字典类型创建
y = pd.Series({
'a':25,'b':25,'c':25})
yy = pd.Series({
'a':9,'b':8,'c':7},index=['c','a','b','d'])
# ndarray创建
n = pd.Series(np.arange(5))
n1 = pd.Series(np.arange(5),index=np.arange(9,4,-1))
# 获取索引和数值
sindex = b.index # 获取索引
svalue = b.values # 获取数值
Series的切片
Series的切片会保存他的索引值
# 只判断是否在索引中
print('c' in b)
print(