【Pandas】pandas concat

Pandas2.2 General

Data manipulations

方法 描述
melt(frame[, id_vars, value_vars, var_name, …]) 将多个列的值转换为行形式
pivot(data, *, columns[, index, values]) 将长格式的数据转化为宽格式
pivot_table(data[, values, index, columns, …]) 用于创建数据透视表,支持多种聚合操作和复杂的数据处理
crosstab(index, columns[, values, rownames, …]) 用于计算交叉表,支持多种聚合操作和复杂的数据处理
cut(x, bins[, right, labels, retbins, …]) 用于将数值数据分割为离散的区间,可以以标签或是区间范围的形式返回
qcut(x, q[, labels, retbins, precision, …]) 基于排名或样本分位数将变量分段为等大小的桶的分位数离散化函数
merge(left, right[, how, on, left_on, …]) 数据合并操作
merge_ordered(left, right[, on, left_on, …]) 用于在两个 DataFrame 之间进行有序合并
merge_asof(left, right[, on, left_on, …]) 用于在两个 DataFrame 之间进行基于最近匹配的合并
concat(objs, *[, axis, join, ignore_index, …]) 用于在不同 DataFrame 或 Series 之间进行拼接操作
get_dummies(data[, prefix, prefix_sep, …]) 用于将类别变量转换为虚拟变量
from_dummies(data[, sep, default_category]) 用于将虚拟变量转换为类别变量
factorize(values[, sort, use_na_sentinel, …]) 用于将类别变量或对象数组转换为数值型编码
unique(values) 用于返回数据中唯一值的数组
lreshape(data, groups[, dropna]) 用于将宽格式的数据转换为长格式
wide_to_long(df, stubnames, i, j[, sep, suffix]) 用于将宽格式数据重塑为长格式数据

pandas.concat()

pandas.concat 是 Pandas 库中用于沿特定轴将多个 pandas 对象堆叠到一起的函数。下面是对 pandas.concat 各个参数的详细介绍,以及示例和结果。

def concat(
    objs: Iterable[Series | DataFrame] | Mapping[HashableT, Series | DataFrame],
    *,
### 使用 Pandas 的 `concat` 函数进行数据合并 在 Pandas 中,`pandas.concat()` 是一种用于沿指定轴(通常是垂直方向或水平方向)连接多个 DataFrame 或 Series 对象的方法[^1]。 #### 基本语法 ```python import pandas as pd pd.concat(objs, axis=0, join='outer', ignore_index=False, keys=None) ``` - `objs`: 要连接的对象列表,可以是 DataFrame 或者 Series。 - `axis`: 连接的方向,默认为 0 表示按行堆叠;设置为 1 则表示按列扩展。 - `join`: 控制索引对齐方式,'outer' (默认)会取所有输入对象中的唯一索引组合而成的新索引;'inner' 只保留共同拥有的索引部分。 - `ignore_index`: 如果设为 True,则不会考虑原始索引而创建新的整数型索引。 - `keys`: 当有多个层次化键时使用的标签序列。 #### 示例代码展示 假设存在两个简单的 DataFrame: ```python df1 = pd.DataFrame({'A': ['A0', 'A1'], 'B': ['B0', 'B1']}) df2 = pd.DataFrame({'A': ['A2', 'A3'], 'B': ['B2', 'B3']}) print("Original DataFrames:") print(df1) print() print(df2) # 按照行进行拼接 result_row_wise = pd.concat([df1, df2], axis=0) print("\nConcatenated by rows:") print(result_row_wise) # 按照列进行拼接 result_column_wise = pd.concat([df1, df2], axis=1) print("\nConcatenated by columns:") print(result_column_wise) ``` 上述例子展示了如何通过调整参数来实现不同类型的合并效果。对于更复杂的场景,比如带有重复列名的数据框之间的合并,可能还需要额外处理冲突等问题。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

liuweidong0802

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值