pandas 操作

本文介绍了使用 Pandas 进行数据处理的多个实用技巧,包括多列排序、去重、分组统计、调整 DataFrame 显示设置及列转字典等操作。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1. 根据多列依次进行排序

https://yiyibooks.cn/meikunyuan6/pandas/pandas/generated/pandas.DataFrame.sort_values.html#pandas.DataFrame.sort_values

先根据第一列,然后再根据第二列进行排序

df.sort_values(by=['col1', 'col2'], ascending=[False,False])

 2. 根据某一列去重

https://yiyibooks.cn/meikunyuan6/pandas/pandas/generated/pandas.DataFrame.drop_duplicates.html#pandas.DataFrame.drop_duplicates

3. 根据某一列,计算分组情况

https://yiyibooks.cn/meikunyuan6/pandas/pandas/generated/pandas.DataFrame.groupby.html#pandas.DataFrame.groupby

data.groupby(['col1', 'col2']).size()

4. pandas 关于DataFrame行, 列显示不完全(省略)的解决办法

#显示所有列
pd.set_option('display.max_columns', None)
#显示所有行
pd.set_option('display.max_rows', None)
#设置value的显示长度为100,默认为50
pd.set_option('max_colwidth',100)
 

参考博客:pandas中关于DataFrame行,列显示不完全(省略)的解决办法_Week.D.Awn的博客-优快云博客_pandas 显示所有列

5. pandas两列转换为字典的键和值

两个列表转换为dataframe

import pandas as pd
import pandas as pd
a = ['Mary','Sellina','Zaca']
b = [26,28,27]
data = {'name':a,'age':b}
df = pd.DataFrame(data)
print(df)

dataframe转换为字典

df1 = df.set_index(['name'])['age'].to_dict()
print(df1)
结果如下:
{'Mary': 26, 'Sellina': 28, 'Zaca': 27}

列名变成字典的key

df2 = df.to_dict(orient = 'list')
结果如下:
{'name': ['Mary', 'Sellina', 'Zaca'], 'age': [26, 28, 27]}

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值