Pandas实现数据的合并concat

本文详细介绍了Pandas库中concat和append函数在数据合并方面的使用,包括场景应用、语法解析、实例演示,从按行到按列合并,再到添加列与Series。重点讲解了如何通过参数调整实现不同类型的合并,并展示了DataFrame的灵活运用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

一、合并的使用介绍
1、使用场景:
批量合并相同格式的Excel、给DataFrame添加行、给DataFrame添加列
2、一句话说明concat语法:
使用某种合并方式(inner/outer)
沿着某个轴向(axis=0/1)
把多个Pandas对象(DataFrame/Series)合并成一个。
3、concat语法:pandas.concat(objs, axis=0, join=‘outer’, ignore_index=False)
objs:一个列表,内容可以是DataFrame或者Series,可以混合
axis:默认是0代表按行合并,如果等于1代表按列合并
join:合并的时候索引的对齐方式,默认是outer join,也可以是inner join
ignore_index:是否忽略掉原来的数据索引
4、append语法:DataFrame.append(other, ignore_index=False)
append只有按行合并,没有按列合并,相当于concat按行的简写形式
other:单个dataframe、series、dict,或者列表
ignore_index:是否忽略掉原来的数据索引
二、使用pandas.concat合并数据
import pandas as pd
import warnings
warnings.filterwarnings('ignore')
df1 = pd.DataFrame({'A': ['A0', 'A1', 'A2', 'A3'],
                    'B': ['B0', 'B1', 'B2', 'B3'],
                    'C': ['C0', 'C1', 'C2', 'C3'],
                    'D': ['D0', 'D1', 'D2', 'D3'],
                    'E': ['E0', 'E1', 'E2', 'E3']
                   })
df2 = pd.DataFrame({ 'A': ['A4', 'A5', 'A6', 'A7'],
                     'B': ['B4', 'B5', 'B6', 'B7'],
                     'C': ['C4', 'C5', 'C6', 'C7'],
                     'D': ['D4', 'D5', 'D6', 'D7'],
                     'F': ['F4', 'F5', 'F6', 'F7']
                   })

df1
在这里插入图片描述
df2
在这里插入图片描述

1、默认的concat,参数为axis=0、join=outer、ignore_index=False
pd.concat([df1,df2])

在这里插入图片描述

2、使用ignore_index=True可以忽略原来的索引
pd.concat([df1,df2], ignore_index=True)

在这里插入图片描述

3、使用join=inner过滤掉不匹配的列
pd.concat([df1,df2], ignore_index=True, join="inner")

在这里插入图片描述

4、使用axis=1相当于添加新列

df1
在这里插入图片描述

5、添加一列Series
s1 = pd.Series(list(range(4)), name="F")
pd.concat([df1,s1], axis=1)

在这里插入图片描述

6、添加多列Series
s2 = df1.apply(lambda x:x["A"]+"_GG", axis=1)

s2
在这里插入图片描述

s2.name="G"
pd.concat([df1,s1,s2], axis=1)

在这里插入图片描述

# 列表可以只有Series
pd.concat([s1,s2], axis=1)

在这里插入图片描述

# 列表是可以混合顺序的
pd.concat([s1,df1,s2], axis=1)

在这里插入图片描述

三、使用DataFrame.append按行合并数据
df1 = pd.DataFrame([[1, 2], [3, 4]], columns=list('AB'))
df1

在这里插入图片描述

df2 = pd.DataFrame([[5, 6], [7, 8]], columns=list('AB'))
df2

在这里插入图片描述

1、给1个dataframe添加另一个dataframe
df1.append(df2)

在这里插入图片描述

2、忽略原来的索引ignore_index=True
df1.append(df2, ignore_index=True)

在这里插入图片描述

3、可以一行一行的给DataFrame添加数据
# 一个空的df
df = pd.DataFrame(columns=['A'])
df

在这里插入图片描述

4、低性能版本
for i in range(5):
    # 注意这里每次都在复制
    df = df.append({'A': i}, ignore_index=True)
df

在这里插入图片描述

5、性能好的版本
# 第一个入参是一个列表,避免了多次复制
pd.concat(
    [pd.DataFrame([i], columns=['A']) for i in range(5)],
    ignore_index=True
)

在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值