数据规整
pd.merge()


如果没有对应的key值,而索引可以对应,可以设置按索引链接:

需要着重记住 left_on 和 right_index 两个参数

join()
要求两组数据没有重叠的列


pd.concat()
np.concatenate()
pd.cancat()
- 默认axis = 0
- join默认为outer
- Series合并时查看索引有无重复
pd.concat([data1,data2],axis = 1)
stack() unstack()
将多层索引转换为Series
r = data.stack()
转变回去
r.unstack()
r.unstack(1)
r.unstack(‘姓名’)
可以指定 0 或者 1 来指定分层的依据
也可以指定行和列的name值 来达到同样的效果



stack()默认过滤na值,如果不想过滤,可以填入参数 dropna = False
本文讲解如何在没有键值的情况下利用索引进行数据融合,包括pd.merge中left_on和right_index的使用,以及pd.concat、np.concatenate和pd.concat函数的异同。重点介绍Series的合并、stack/unstack操作及其参数设置,帮助理解多层索引的转换和处理。
868

被折叠的 条评论
为什么被折叠?



