pandas 行列转换

最新推荐文章于 2025-01-01 21:33:13 发布

learningcoder

最新推荐文章于 2025-01-01 21:33:13 发布

阅读量1.1k

点赞数

CC 4.0 BY-SA版权

分类专栏： python 数据分析 pandas

本文链接：https://blog.youkuaiyun.com/learningcoder/article/details/103675393

python 同时被 3 个专栏收录

9 篇文章

订阅专栏

数据分析

6 篇文章

订阅专栏

pandas

4 篇文章

订阅专栏

# -*- coding:utf-8 -*-
import pandas as pd

# 一行转多行
df = pd.DataFrame(
    {'Code': ['1111', '2222'],
     'Color': ['a, b, c,d', 'blue, pink, yellow'],
     'Size': ['1, 2, 3', '7, 6, 10']}
)
id_df = df[["Code"]]

# stack函数会将数据从”表格结构“变成”花括号结构“，即将其行索引变成列索引
# 参考 https://www.cnblogs.com/bambipai/p/7658311.html
for col in df.columns[1:]:
    split_df = df[col].str.split(",", expand=True).stack().reset_index(level=1, drop=True).rename(col)
    id_df = id_df.join(split_df)

# 删除行索引并重建
convert_df = id_df.reset_index(drop=True)

print(convert_df)

df = pd.DataFrame(
    {"id": [2, 3, 3, 3],
     "name": ["tx", "hw", "hw", "hw"],
     "sub": ["game", "mobile", "cell", "cloud"]
     }
)


# 多行转一行

def collect(ls):
    return ",".join(ls)


df2 = df.groupby(["id", "name"])["sub"].apply(collect).rename("subs")
df2.reset_index()