pandas 常用命令

博客介绍了一系列数据处理操作,包括按新旧字典格式更改列名,多表合并(列不同时按列名合并,列相同可用append插入),按两列条件选取数据,去掉字符串括号、特殊字符、不想要的数据,去除含nan的行以及按列值去重。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

  1. 更改列名:(按照列表新旧字典格式更改) df.rename(columns={'name':'school'},inplace=True)
  2. 多表合并(列不一样时,按照列名为key,合并方式可以通过参数修改,对应sql的形式)df_norm = pd.merge(df_1,df_2,how = 'inner',on = 'school') 用并集的形式合并df_data_bingji = pd.concat([df,diff_data],axis =0) 当两个表列的形式相同时,可以直接用append方法直接插入,res_bingji = diff_data.append(df)
  3. 按照两列条件来选取数据 df_norm_all = df_norm.loc[df_norm['school']==df_norm['search_name']]
  4. 去掉字符串中的() def del_bracket(str): str = str.replace('(','').replace(')','') return str
  5. 对某一列执行去掉特殊字符操作res_bingji['other_name'] = res_bingji['other_name'].apply(del_bracket)
  6. 去掉某一列中不想要的数据 s = pd.Series('南京审计大学') df_not_get = df[~df['highest_school'].isin(s)]
  7. 按照某些列数据去掉列值为nan的整行数据 df.dropna(axis=0,how = 'all',subset=['category','property'],inplace=True)
  8. 按某一列的值进行去重 df_stand_name_guanxi.drop_duplicates(subset=['stand_name'],keep='first',inplace=True)
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值