Pandas深度:数据操作全解析
在数据处理和分析的过程中,我们常常需要对从不同来源获取的数据进行整合、转换和清理。Pandas作为Python中强大的数据处理库,提供了丰富的功能来完成这些任务。本文将详细介绍Pandas中数据操作的主要方法,包括合并、拼接、组合、透视以及数据转换等。
1. 数据合并(Merging)
数据合并是将两个或多个DataFrame根据一个或多个键连接起来的操作,类似于SQL中的JOIN操作。Pandas提供了 merge()
函数来实现这一功能。
1.1 基本合并
首先,我们需要导入必要的库并创建两个示例DataFrame:
import numpy as np
import pandas as pd
frame1 = pd.DataFrame({'id': ['ball', 'pencil', 'pen', 'mug', 'ashtray'],
'price': [12.33, 11.44, 33.21, 13.23, 33.62]})
frame2 = pd.DataFrame({'id': ['pencil', 'pencil', 'ball', 'pen'],
'color': ['white', 'red', 'red', 'black']})
print(frame1)
print(frame2)
然后,使用 merge()
函数进行合并: