python中concat的用法_pandas中concat()的用法

这篇博客介绍了pandas.concat()在Python中的使用,包括如何进行纵向和横向连接DataFrame对象。通过实例展示了当DataFrame列完全相同或不同时的连接方式,并解释了如何处理索引和选择性合并。同时,还提到了通过设置axis参数实现DataFrame的横向合并。

pandas.concat()通常用来连接DataFrame对象。默认情况下是对两个DataFrame对象进行纵向连接, 当然通过设置参数,也可以通过它实现DataFrame对象的横向连接。

让我们通过几个例子来看看concat()的用法。

1. 纵向连接DataFrame对象

(1)两个DataFrame对象的列完全相同

# 初始化两个DataFrame对象

df1 = pd.DataFrame([['a', 1], ['b', 2]],

columns=['letter', 'number'])

df2 = pd.DataFrame([['c', 3], ['d', 4]],

columns=['letter', 'number'])

display(df1)

display(df2)

# 合并对象

pd.concat([df1, df2])

从上面的结果可以看出, concat默认纵向连接DataFrame对象, 并且合并之后不改变每个DataFrame子对象的index值, 因此我们可以在合并之后的DataFrame中看到index的值0和1重复了两次。

如果希望重新设置合并之后的DataFrame对象的index值, 可以添加ignore_index=True参数:

pd.concat([df1, df2], ignore_index=True)

(2) 两个DataFrame对象的列不完全相同

# 初始化DataFrame对象

df1 = pd.DataFrame([['a', 1], ['b', 2]],

columns=['letter', 'number'])

df3 = pd.DataFrame([['c', 3, 'cat'], ['d', 4, 'dog']],

columns=['letter', 'number', 'animal'])

display(df1)

display(df3)

# 合并对象

pd.concat([df1, df3], sort=False) # sort=False : 列的顺序维持原样, 不进行重新排序。

从结果可以看到, 因为df1中没有animal列, 所以在合并之后的DataFrame对象里, 所对应的元素都被设置成了NaN。

如果只想合并相同的列, 我们可以添加上join='inner'参数:

pd.concat([df1, df3], join='inner')

2. 横向合并DataFrame对象

通过设置axis=1, 可以横向合并两个DataFrame对象。

# 初始化DataFrame对象

df1 = pd.DataFrame([['a', 1], ['b', 2]],

columns=['letter', 'number'])

df4 = pd.DataFrame([['bird', 'polly'], ['monkey', 'george']],

columns=['animal', 'name'])

display(df1)

display(df4)

# 合并对象

pd.concat([df1, df4], axis=1)

从上面的结果可以看出,通过设置axis=1参数,我们实现了df1和df4两个DataFrame对象的合并。

以上就是关于pandas.concat()函数用法的简单介绍。

参考资料

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值