需要把下面的dataframe里面列的数据类型是list的列拆分成多个行:
df=pd.DataFrame({‘A’:[1,2],‘B’:[[1,2],[1,2]]})
df
Out[458]:
A B
0 1 [1, 2]
1 2 [1, 2]
所用代码如下:
(1)如果你要拆分的dataframe只有两列,那么使用下面的方法(亲测非常高效):
df=pd.DataFrame({‘A’:df.A.repeat(df.B.str.len()),‘B’:np.concatenate(df.B.values)})
df
Out[465]:
A B
0 1 1
0 1 2
1 2 1
1 2 2
(2)如果要拆分的dataframe有多列,那么可能需要使用下面的方法(还没有尝试过,期待有机会尝试),需要使用到numpy:
newvalues=np.dstack((np.repeat(df.A.values,list(map(len,df.B.values))),np.concatenate(df.B.values)))
pd.DataFrame(data=newvalues[0],columns=df.columns)
A B
0 1 1
1 1 2
2 2 1
3 2 2
参考:
https://www.cjavapy.com/article/237/
本文详细介绍了一种在Pandas中将包含列表的列高效展开为多行的有效方法,适用于只有两列的情况,并提供了一个更通用但未验证的多列处理方案。通过实例演示了如何利用repeat和concatenate函数实现数据的扁平化处理。
1436





