Python实现拆分列至多行(一行代码)

jogarys

已于 2023-06-28 08:32:20 修改

阅读量806

点赞数 2

CC 4.0 BY-SA版权

分类专栏： Python Spotfire 文章标签： python 数据分析

于 2023-06-27 20:23:26 首次发布

本文链接：https://blog.youkuaiyun.com/weixin_46156257/article/details/131424426

Python 同时被 2 个专栏收录

23 篇文章

订阅专栏

Spotfire

12 篇文章

订阅专栏

文章介绍了一种在Python中使用Pandas库的explode方法来高效地将数据集中的多值列拆分为多行的方法。通过对比硬编码实现，explode提供了显著的性能提升，特别是在处理大量数据时。示例展示了如何将包含逗号分隔值的DataFrame转换为每个id对应一行的结构。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

假设有如下数据：

id	value1	value2	value3
张三	a2,a4,a5	1,3,5	0.5,-0.5,-3
李四	a3,a4,a7	1,3,6	0.8,-0.5,-3
麻子	a2,a4,a8	2,4,6	-0.5,0.4,3

需求是将每个id的value值展开至多行，刚开始我尝试硬写代码来实现拆分，结果发现代码很麻烦，而且数据量大时性能很差，其实可以使用dataframe自带的explode()函数来拆分，只需一行代码即可实现，且性能很好，实测约提升了10倍。

#构建数据集
import pandas as pd
dic = {
'id':['张三','李四','麻子'],
'value1':['a2,a4,a5','a3,a4,a7','a2,a4,a8'],
'value2':['1,3,5','1,3,6','2,4,6'],
'value3':['0.5,-0.5,-3','0.8,-0.5,-3','-0.5,0.4,3']
}
before=pd.DataFrame(dic)
before.to_csv('before.csv',encoding='gbk')

after = before.set_index(['id']).apply(lambda x: x.str.split(',').explode()).reset_index()
after

输出如下：