pandas的基本操作(一)
1.pandas的基本数据结构
目前,pandas的基本数据结构有3种,Series,DataFrame和Pandel。要想熟练使用Pandas,这三种数据结构一定要牢记于心。其中DataFrame使用频率最高。
数据结构 | 维度 | 轴标签 |
---|---|---|
Series | 一维 | index(唯一的行) |
DataFrame | 二维 | index(行)和columns(列) |
Pandel | 三维 | items major_axis和 minor_axis |
2.Series的数据结构
Series 是一维的,基本创建方式为:
pd.Series(data=None,index=None)
- data: 传入数据,可以是多种类型,包括numpy
- index 引索,在不指定的情况下,默认全部数据 ,即rang(0,len(data))
eg.
obj = pd.Series([4, 7, -5, 3, 7, np.nan])
obj~
输出:
0 4.0
1 7.0
2 -5.0
3 3.0
4 7.0
5 NaN
dtype: float64
3.DataFrame数据结构
DataFrame是最最常用的结构,它是一种表格型的数据结构,有行索引和列索引。
创建方式:pd.DataFrame(data=None,index=None,columns=None)
- data:传入数据,可是传入多种类型。
- index: 列引索 ,不指定自动填充
- columns: 行引索 ,不指定自动填充
1 numpy 创建
import pandas as pd
import numpy as np
df = pd