数据分析(三)Pandas数据结构基础3.Pandas的层次化索引,数据合并,文件存取excel文件

最新推荐文章于 2025-07-16 18:44:12 发布

原创

最新推荐文章于 2025-07-16 18:44:12 发布 · 954 阅读

1 ·

CC 4.0 BY-SA版权

这篇博客介绍了Pandas的层次化索引，包括设置索引字段和多级索引的用法。接着讲解了Pandas数据合并的多种方式，如外连接、左连接、右连接，并展示了如何创建查询表。最后，重点讨论了Pandas读取和保存Excel文件的方法，包括使用pd.read_excel()和data.to_csv()。文章提供了实际的代码示例和注意事项。

本文内容来自网易云课堂微专业数据分析学习笔记,授课为毕滢老师

安装更新pandas:pip install pandas --upgrade i https://mirrors.163.com/pypi/simple/

Pandas的层次化索引

同一个轴可以用多种方式索引(有类似于excel排序第1关键字第2关键字的意思)

book_ratings=pd.Series(
	np.random.randint(1,6,size=7),#待查询理解
	index=[
	['b1','b1','b2','b2','b3','b4','b4'],
	[1,2,1,2,1,2,3]#有类似于excel排序第1关键字第2关键字的意思
	]
	)
print(book_ratings)

给一个DataFrame指定索引字段

data.set_index(['指定索引字段名']) #当字段被指定为索引之后,在col里就视为没有了.
lookup=data2.set_index(['book_id','best_book_id']) #当索引字段是一个的时候,加不加方括号不影响,但有2个,则只有加了[]才有效.

Pandas数据合并

1.两个DataFrame进行合并(类似集合的操作)

book_name=pd.DataFrame({
	'book_name':['a','b','c','d','e','f'],
	'book_id':[11,22,33,44,55,66]              #两者都有'book_id'
	})
id_rating=pd.DataFrame({
	'book_id':[11,22,22,44,55,66,33,11,55],    #两者都有'book_id'
	'rating':[1,3,5,2,4,3,2,4,5]
	})
print(pd.merge(book_name,id_rating))