import pandas as pd
import numpy as np
1.numpy的数据合并(concatenate,将两个ndarray合并为一个ndarray)
默认是进行列合并,通过指定axis=1可以对行进行合并

2.Series的数据合并(concat)
1.当各个表的索引值没有重复的情况
默认是按列合并

如果指定axis=1,进行按行合并的话,则会生成一个DataFrame对象,并且值那一列将会错开,缺失值填充为NaN

2.当各个表的索引值发生重复
按列合并时,重复索引还是会出现,按行合并时,将会出现重复索引被共用的情况,无法被公用的索引还是会产生缺失值,填充为NaN值,默认合并时都是外连接,就是会显示所有的数据

通过join参数可以指定内外连接(join="inner"或者join="outer")

3.DataFrame的数据合并
默认合并还是按列合并,以外连接的形式,显示所有数据,修改axis=1可以改为按行合并,共有索引的数据被合并,缺失值填充为NaN,也可以通过join参数修改内外连接

本文介绍了numpy和pandas的数据合并操作。在numpy中,使用concatenate函数进行列(axis=0)或行(axis=1)合并。在Series中,合并时考虑索引值的重复情况,可以通过axis和join参数调整合并方式。对于DataFrame,默认按列合并,同样可调整为按行合并,并通过join参数选择内连接或外连接。
994

被折叠的 条评论
为什么被折叠?



