举例:pandas中,将如下形式的data1转换为 data2?
data1:
| user | item |
|---|---|
| A | a |
| A | b |
| A | c |
| B | a |
| B | d |
data2:
| user | item |
|---|---|
| A | [a,b,c] |
| B | [a,d] |
hive中可直接使用concat_ws函数,python中暂时没有找到可以直接用的函数,如果知道,请在评论中告诉我,多谢啦!
我的方式是:data2 = data1.groupby('user')['item'].apply(lambda x:list(x)).reset_index()
本文详细介绍了如何使用Python的Pandas库将重复项的数据转换为列表格式,通过groupby和apply函数实现高效的数据整理,适用于数据预处理和分析场景。
举例:pandas中,将如下形式的data1转换为 data2?
data1:
| user | item |
|---|---|
| A | a |
| A | b |
| A | c |
| B | a |
| B | d |
data2:
| user | item |
|---|---|
| A | [a,b,c] |
| B | [a,d] |
hive中可直接使用concat_ws函数,python中暂时没有找到可以直接用的函数,如果知道,请在评论中告诉我,多谢啦!
我的方式是:data2 = data1.groupby('user')['item'].apply(lambda x:list(x)).reset_index()
1226

被折叠的 条评论
为什么被折叠?