使用Pandas的apply函数将多个数据列整合成元组形式并生成新的数据列
在数据分析过程中,我们常常需要将多个数据列合并成一个数据列,这个数据列包含着多个数据信息。本篇文章将介绍如何使用Pandas的apply函数将多个数据列整合成元组形式,并在DataFrame中生成新的数据列。
假设有以下表格:
| 姓名 | 年龄 | 职业 |
|---|---|---|
| 张三 | 20 | 工程师 |
| 李四 | 30 | 营销经理 |
| 王五 | 25 | 数据分析师 |
我们希望将“姓名”、“年龄”、“职业”这3个字段整合成一个元组,并生成一个新的数据列。具体步骤如下:
Step1: 导入相关库
import pandas as pd
Step2: 创建DataFrame
data = {'姓名': ['张三', '李四', '王五'],
'年龄': [20, 30, 25],
'职业': ['工程师', '营销经理', '数据分析师']}
df = pd.DataFrame(data)
Step3: 编写函数
本文介绍了如何使用Pandas的apply函数,将DataFrame中的多个数据列如'姓名'、'年龄'、'职业'组合成元组,并生成新的数据列。通过编写函数,结合axis=1进行按行操作,实现数据的批量处理。
订阅专栏 解锁全文
459

被折叠的 条评论
为什么被折叠?



