一、pandas DataFrame对象的创建
1、从列表list创建
2、从字典创建
3、从Numpy中产生的随机数创建
4、从文件创建
代码见pandas对象的创建.py
二、pandas DataFrame的切片操作(即二维表的筛选)
1、切片有以下几种方式
比如df是一个DataFrame对象,那么:
df[行][列]
df.loc[行,列]
df.iloc[行,列]
df.ix不推荐使用
df[行][列]与df.loc[行,列]比较:
1.如果必须以’姓名’:'4月圈数’方式指定连续的列,只能用后者
2.如果想改变列的顺序,只能用前者
以上两者都不能指定列编号,iloc函数可以指定行号和列编号
2、筛选通常包括
选取指定行,指定列(行连续或不连续,列连续或不连续)
按条件选取行
示例见pandas切片操作练习_南湖跑0.py 和pandas切片操作练习_南湖跑1.py
三、pandas DataFrame的修改操作
1、列的新增和删除
2、列的赋值
3、列名的更改
4、对满足条件的行中指定的列赋值
5、根据其他列计算结果填充某列
四、汇总函数
df.sum(axis=0) #axis=1 表示在行方向上求和 axis=0 表示在列方向上求和
df.mean()
df.groupby(‘列名’).sum() 分类汇总求和
df[‘学院’==‘水产学院’].count()
df.apply()将某函数施加在数据集的行或者列上
五、表与表之间的合并
f_inner=pd.merge(df,df1,how=‘inner’) # 匹配合并,交集
df_left=pd.merge(df,df1,how=‘left’) #
df_right=pd.merge(df,df1,how=‘right’)
df_outer=pd.merge(df,df1,how=‘outer’) #并集
f1.append(df2):将df2中的行添加到df1的尾部
df.concat([df1, df2],axis=1):将df2中的列添加到df1的尾部
df1.join(df2,on=col1,how=‘inner’):对df1的列和df2的列执行SQL形式的join
pandas概貌预览:入门
列出大部分函数:
https://www.cnblogs.com/fly-kaka/p/6860935.html
列出大部分函数,并举例:
https://blog.youkuaiyun.com/liufang0001/article/details/77856255