在数据处理过程中,经常会遇到以下类型的数据:

在同一列中,本该分别填入多行中的数据,被填在一行里了,然而在分析的时候,需要拆分成为多行。
在上图中,列名为”Country” ,index为4和5的单元格内,值为”UK/Australia”和”UK/Netherland”。
今天,我们来介绍将含有多值的内容分拆成多行的几种方法。
加载数据
PS:可以通过左右滑动来查看代码
import pandas as pd
df = pd.DataFrame({'Country':['China','US','Japan','EU','UK/Australia', 'UK/Netherland'],
'Number':[100, 150, 120, 90, 30, 2],
'Value': [1, 2, 3, 4, 5, 6],
'label': list('abcdef')})
df
Out[2]:
Country Number Value label
0 China 100 1 a
1 US 150 2 b
2 Japan 120 3
本文介绍了如何在Pandas中处理数据时,将包含多个值的一列文本拆分为多行。方法-1通过拆分、变换和设置index实现,方法-2与之类似,细节略有不同。这两种方法可以帮助将如'Country'列中的'UK/Australia'和'UK/Netherland'等值分开,以便于数据分析。
订阅专栏 解锁全文
1938

被折叠的 条评论
为什么被折叠?



