数据处理与可视化全解析
1. Pandas 数据合并操作
Pandas 提供了 SQL 风格的合并操作,以下是几种常见的合并方式:
1.1 左连接(Left Join)
左连接会生成表 A 的完整记录集,若表 B 中有匹配记录则显示,无匹配时右侧为 null。可以添加后缀避免列名重复,若未提供,会自动为表 A 列名添加 x ,为表 B 列名添加 y 。
# Left join
print(pd.merge(df_1, df_2, on='emp_id', how='left'))
# Merge while adding a suffix to duplicate column names of both table
print(pd.merge(df_1, df_2, on='emp_id', how='left', suffixes=('_left', '_right')))
1.2 右连接(Right Join)
右连接会生成表 B 的完整记录集,若表 A 中有匹配记录则显示,无匹配时左侧为 null。
pd.merge(df_1, df_2, on='emp_id', how='right')
1.3 内连接(Inner Join)
内连接仅生成表 A 和表 B 中匹配的记录集。
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



