需要把下面的dataframe里面列的数据类型是list的列拆分成多个行:
df=pd.DataFrame({'A':[1,2],'B':[[1,2],[1,2]]})
df
Out[458]:
A B
0 1 [1, 2]
1 2 [1, 2]
所用代码如下:
(1)如果你要拆分的dataframe只有两列,那么使用下面的方法(亲测非常高效):
df=pd.DataFrame({'A':df.A.repeat(df.B.str.len()),'B':np.concatenate(df.B.values)})
df
Out[465]:
A B
0 1 1
0 1 2
1 2 1
1 2 2
(2)如果要拆分的dataframe有多列,那么可能需要使用下面的方法(还没有尝试过,期待有机会尝试),需要使用到numpy:
newvalues=np.dstack((np.repeat(df.A.values,list(map(len,df.B.values))),np.concatenate(df.B.values)))
pd.DataFrame(data=newvalues[0],columns=df.columns)
A B
0 1 1
1 1 2
2 2 1
3 2 2
参考:
本文介绍了一种在Pandas中将包含列表的列展开为多行的有效方法,适用于两列或多列的情况,通过实例展示了如何使用numpy和Pandas函数实现这一操作。
1330

被折叠的 条评论
为什么被折叠?



