1. 根据多列依次进行排序
先根据第一列,然后再根据第二列进行排序
df.sort_values(by=['col1', 'col2'], ascending=[False,False])
2. 根据某一列去重
3. 根据某一列,计算分组情况
data.groupby(['col1', 'col2']).size()
4. pandas 关于DataFrame行, 列显示不完全(省略)的解决办法
#显示所有列
pd.set_option('display.max_columns', None)
#显示所有行
pd.set_option('display.max_rows', None)
#设置value的显示长度为100,默认为50
pd.set_option('max_colwidth',100)
参考博客:pandas中关于DataFrame行,列显示不完全(省略)的解决办法_Week.D.Awn的博客-优快云博客_pandas 显示所有列
5. pandas两列转换为字典的键和值
两个列表转换为dataframe
import pandas as pd
import pandas as pd
a = ['Mary','Sellina','Zaca']
b = [26,28,27]
data = {'name':a,'age':b}
df = pd.DataFrame(data)
print(df)
dataframe转换为字典
df1 = df.set_index(['name'])['age'].to_dict()
print(df1)
结果如下:
{'Mary': 26, 'Sellina': 28, 'Zaca': 27}
列名变成字典的key
df2 = df.to_dict(orient = 'list')
结果如下:
{'name': ['Mary', 'Sellina', 'Zaca'], 'age': [26, 28, 27]}