合并
pandas中的合并操作和sql中的join操作非常相似。
假设有df1,df2需要合并,参数on代表通过那个键合并:
# 通过key字段合并,类似于 mysql 的 select * from df1 inner join df2 on df1.key = df2.key
pd.merge(df1,df2,on='key')
如果用于合并的键位名字不同,我们也可以分别制定:
# df1的leky和df2的rkey合并
pd.merge(df1,df2,left_on='lkey',right_on='rkey')
sql中的合并方式有多种,有 left join,right join 等等,pandas中我们使用参数 how 来选取合并方式:
pd.merge(df1,df2,how='outer')
联接
不同于merge , concat更类似于在横向(axis = 1)或者纵向 (axis = 0) 累加。详细参考利用python进行数据分析
参考文献:
[1] 利用python进行数据分析
本文详细介绍了如何使用Python的Pandas库进行数据合并与联接操作,包括内连接、外连接等不同类型的合并方式,以及如何指定左右数据框的键进行合并,最后对比了merge与concat的不同用法。
5242

被折叠的 条评论
为什么被折叠?



