如有错误欢迎指正~
文章目录
前言
在数据分析的过程中数据的重构是非常重要的,本篇文章将详细讲解pandas中四个重要的连接函数:concat(), merge(), join(), append()#我们先来导入pandas和numpy
import pandas as pd
import numpy as np
一、concat()
- 沿特定轴(axis)连接对象,也可以在连接轴上添加层级索引(index)
1. 参数详解
pd.concat(
objs, #对象:Series,DataFrame或Panel的序列,如果传递了字典,字典的键值将会被作为键参数
axis=0, #选择连接轴:默认为0,代表行/index;当axis=1时,代表列/columns
join='outer', #处理其他轴上的索引:默认为'outer',取并集;当join='inner'时,取交集
ignore_index: bool = False, #是否重置连接轴的索引,默认为False;当ignore_index=True,将按照[0,1,……,n-1]重置连接轴上的索引
keys=None, #用传入的键作为最外层索引。如果为多层次索引,当使用元组
levels=None, #构建多层次索引
names=None, #多层次索引中级别的名称
verify_integrity: bool = False, #检查新连接的轴是否包含重复项
sort: bool = False,
copy: bool = True,
)
2. 举例说明
首先建立三个数据集
df1 = pd.DataFrame([['a', 1], ['b', 2]], columns = ['letter', 'number'])
df2 = pd.DataFrame([[

本文详细介绍了Pandas中用于数据连接的四个关键函数:concat()、append()、join()和merge()。concat()允许按行或列连接数据,并能创建多层次索引;append()仅能按行追加数据;join()通过索引快速合并列;merge()则通过指定键进行列合并,提供更灵活的数据融合方式。
最低0.47元/天 解锁文章
912

被折叠的 条评论
为什么被折叠?



