数据结构
1.系列
用于储存一行或者一列的数据,以及与之相关的索引的集合;(与列表相似)
from pandas import Series;
x = Series(['a',True, 1], index=['first','second','third']);
追加新元素
这里需要对追加的结果进行接收,这里与列表的方式不同!
n = Series(['2'])
x = x.append(n) # 追加的索引默认为0
判断存在:
'2' in x
'2' in x.values
切片方式与列表相同,左闭右开;
删除:
x = x.drop(0) # 删除索引全部是0的内容
x = x.drop('first')
x = x.drop(x.index[3]) # 删除索引是第三个的所有内容
2.数据框
多行多列(相当于excel的表格);
概念:行、列、位置、行名、列名;
from pandas import DataFrame
df = DataFrame({
'age': [21,22,23],
'name':['KEN','John','Jing']
})
# 自定义索引
df = DataFrame1(data = {
'age': [21,22,23],
'name':['KEN','John','Jing']
}, index = ['first','second','third']
)
按行访问
df['age']
按列访问
注意:访问第二行要使用1:2,而不能仅仅使用1
df[1:2]
按行列号访问;
按行索引和列名访问;
df.iloc[0:1,0:1]
df.at['first','age']
修改列名
df.columus = ['age2','name2']
修改行索引
df.index = range(1,4)
根据行索引删除整个行
df.drop(1)
根据列名删除整列
此时都不需要进行接收
df.drop('age2', axis = 1) # 按列要将轴参数改为1,默认为0
del df[age2]
增加行
df.loc[len(df)] = [24,"KEN"]
增加列
df['newColumn'] = [2,4,6,8]