基本操作
>1.查看前5个值和后三个值
>df2.head()
>df2.tail(3)
>2.查看列名,值,以及索引
>df2.columns
>df2.values
>df2.index
>3.查看统计数据
>df2.describe()
>4.转置操作
>df2.T
>5.通过标签查询
>df2['age',’animal'.......]多列查询
>6.按行查询
>df2.iloc[1:3] # 查询 2,3 行
>7.按照坐标查询
>df3.iat[1,0] #2行1列的数据
>8.按照标签和索引进行查询
>df3.loc['f','age'] #f行,标签为age的数据
>9.添加列数据(创建一个series,然后添加)
>num = pd.Series([0, 1, 2, 3, 4, 5, 6, 7, 8, 9], index=df3.index)
>df3['No.'] = num # 添加以 'No.' 为列名的新数据列
>10.丢弃数据
>data.drop('m1',axis=1) #相当于delete table a where yid='m1'
>data.drop(['a','c']) #相当于delete table a where xid='a' or xid='c'
>df5.dropna(how = 'any') #删除缺失值所在的行
>11.缺失值处理
>df4.fillna(value=3)
>12.条件查找 df['条件']
>df[df['age'] > 3]
>df[(df['animal'] == 'cat') & (df['age'] < 3)]
>df3[df3['animal'].isin(['cat', 'dog'])]
>13.行列索引切片
>df.iloc[2:4, 1:3] #2-4行切片,1-3列切片
>14.排序操作
>df.sort_values(by=['age', 'visits'], ascending=[False, True])
>15.DataFrame 多值替换
>df['priority'].map({'yes': True, 'no': False}) #yes替换为True,no为False
>16.分组操作
>df4.groupby('animal').sum()
文件操作
>1.CSV 文件写入
>df3.to_csv('animal.csv')
>2.CSV 文件读取
>df_animal = pd.read_csv('animal.csv')
>3.Excel 写入操作
>df3.to_excel('animal.xlsx', sheet_name='Sheet1')
>4.Excel 读取操作
>pd.read_excel('animal.xlsx', 'Sheet1', index_col=None, na_values=['NA'])
>5.求中位数
>s1.median()
>6.求最大值
>s1.max()
>7.求和
>s1.sum()