Python：Pandas dataframe 如何拆分某一列，将结果分别与另一列匹配？

最新推荐文章于 2025-04-05 16:32:03 发布

原创最新推荐文章于 2025-04-05 16:32:03 发布 · 1.5k 阅读

2 ·

CC 4.0 BY-SA版权

文章标签：

#pandas #python #数据分析

python 专栏收录该内容

87 篇文章

订阅专栏

示例展示了如何在PandasDataFrame中使用str.split()方法拆分full_name列，然后通过apply()和pd.Series转换结果，再利用merge()方法将拆分的数据与first_name列匹配，最终删除多余列，完成数据整理。

在Pandas DataFrame中，可以使用str.split()方法拆分某一列，并使用DataFrame的merge()方法将结果匹配到另一列中。下面是一个简单的示例：

import pandas as pd

# 创建示例DataFrame
df = pd.DataFrame({'full_name': ['John Smith', 'Jane Doe', 'Bob Johnson'],
                   'first_name': ['John', 'Jane', 'Bob'],
                   'last_name': ['Smith', 'Doe', 'Johnson']})

# 拆分full_name列
df['split_name'] = df['full_name'].str.split()

# 将拆分后的结果与first_name列匹配
df = df.merge(df['split_name'].apply(pd.Series).rename(columns={0: 'first_name', 1: 'last_name'}),
              on='first_name')

# 删除不需要的列
df = df.drop(['full_name', 'split_name'], axis=1)

# 输出结果
print(df)

输出：

  first_name last_name_x last_name_y
0       John       Smith       Smith
1       Jane         Doe         Doe
2        Bob     Johnson     Johnson

在上面的示例中，我们首先创建一个包含full_name、first_name和last_name列的DataFrame。然后，我们使用str.split()方法将full_name列拆分为一个新的列split_name。接下来，我们使用apply()方法和pd.Series来将拆分后的结果转换为DataFrame，并将第一个和第二个元素分别重命名为first_name和last_name。最后，我们使用merge()方法将拆分后的结果与first_name列匹配，并删除不需要的列以获得最终结果。