(1)单表实现多值合并操作

本文介绍了一种使用Python pandas库进行人物数据整合的方法,通过将具有相同姓名的人物信息进行合并,并去除重复数据,实现数据的高效管理和分析。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

如下表
在这里插入图片描述
需求:上表有多条数据实际上为同一个人,要求根据姓名把所有数据合并拼接,如有重复数据还需横向去重

import pandas as pd
import numpy as np
import os
os.listdir()
['.ipynb_checkpoints', 'Untitled.ipynb', '人物画像.xlsx']
renwu = pd.read_excel("./人物画像.xlsx")
renwu

在这里插入图片描述

# 设计拼接函数
def pingjie(df):
    return "|".join(set(df.values))
# 需要合并的字段
list_hb = ["性别","爱好","语言能力","去过的地方"]
# list2用来存放每字段合并后的数据
list2 = []
for i in list_hb:
    sj = renwu.groupby("姓名")[i].apply(pingjie)
    list2.append(sj)
# 查看存在list2中的数据的样子
list2[0]
姓名
熊英文    男
王钢     男
葛慧文    女
黄锦涛    男
Name: 性别, dtype: object
shuchu = pd.DataFrame(list2)
shuchu

在这里插入图片描述

# 通过转置,即可以达到我们需要的效果
shuchu1 = shuchu.T.reset_index()
shuchu1

在这里插入图片描述

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值