本文来源公众号“python”,仅用于学术分享,侵权删,干货满满。
原文链接:Python pandas实现数据追加和合并的最佳方法
在数据分析和处理的过程中,经常需要将新的数据追加到现有的数据集上,例如将新的记录添加到数据框(DataFrame)中或将多个数据集合并成一个更大的数据集。Python的pandas库提供了多种方式来高效地追加数据,不论是追加单行、合并多行数据,还是将不同的数据集组合在一起,都能轻松实现。
1 使用append()
追加数据
append()
是pandas中最简单、直观的追加方法之一,它可以将一个或多个数据行添加到现有的DataFrame中,适用于追加单行或多个数据行的情形。
1.1 基本用法
以下示例展示了如何使用append()
方法将一行数据追加到一个DataFrame中:
import pandas as pd
# 创建一个初始的DataFrame
df = pd.DataFrame({
'Name': ['Alice', 'Bob'],
'Age': [24, 27]
})
# 创建一行新数据
new_row = pd.DataFrame({
'Name': ['Charlie'],
'Age': [22]
})
# 使用 append 方法追加数据
df = df.append(new_row, ignore_index=True)
print(df)
输出结果为:
Name Age
0 Alice 24
1 Bob 27
2 Charlie 22
在这里,ignore_index=True
的作用是重置索引,使新行的数据按顺序添加到DataFrame的末尾,并重新生成索引。通常建议将ignore_index
设置为True
,以确保索引顺序保持一