数据处理与可视化:Pandas与Matplotlib实战
1. Pandas数据处理
1.1 数据合并
Pandas提供了SQL风格的合并操作,常见的合并类型有左连接、右连接、内连接和外连接。
1.1.1 左连接
左连接会生成表A的完整记录集,若表B中有匹配记录则显示,无匹配时右侧为null。可以添加后缀避免列名重复,若未提供,会自动为表A列名添加 _x
,为表B列名添加 _y
。
# Left join
print(pd.merge(df_1, df_2, on='emp_id', how='left'))
# Merge while adding a suffix to duplicate column names of both table
print(pd.merge(df_1, df_2, on='emp_id', how='left', suffixes=('_left', '_right')))
1.1.2 右连接
右连接会生成表B的完整记录集,若表A中有匹配记录则显示,无匹配时左侧为null。
pd.merge(df_1, df_2, on='emp_id', how='right')
1.1.3 内连接
内连接仅生成表A和表B中匹配的记录集。