数据合并、聚合与分组操作详解
1. 数据合并操作
1.1 基本合并
在数据处理中,经常需要将不同的数据集合并在一起。例如,有两个数据集 df6 和 df7 ,可以使用 pd.merge() 函数进行合并。默认情况下, pd.merge() 执行的是内连接(inner join),即返回两个输入数据集的交集。
import pandas as pd
df6 = pd.DataFrame({'name': ['Peter', 'Paul', 'Mary'], 'food': ['fish', 'beans', 'bread']})
df7 = pd.DataFrame({'name': ['Mary', 'Joseph'], 'drink': ['wine', 'beer']})
# 内连接合并
merged_inner = pd.merge(df6, df7)
print(merged_inner)
输出结果:
name food drink
0 Mary bread wine
1.2 不同连接类型
除了内连接, pd.merge() 还支持外连接(outer join)、左连接(left join)和右连接(right join)。
- 外连接 :返回输入列的并集,并将
超级会员免费看
订阅专栏 解锁全文
3938

被折叠的 条评论
为什么被折叠?



