介绍
pandas是用于数据分析的Python库,用来处理电子表格数据,并具备可视化与可再现性特点。

整个电子表格在pandas中使用dataframe结构进行表达。每个dataframe可以看作是由多个列组成,这个列在dataframe中称为serie。每个列都有列名,也有行名,只是通常情况下没指定行名。每个行都有自己的行号,行号是从0开始的。如果没有指定行名,则将行号添入行名。行号是隐形索引。每个表格还有大小shape,返回行数与列数。
加载数据
在处理数据首先要加载数据,从各种数据文件中将数据读入dataframe结构,才能使用pandas进行后续处理。加载数据同样需要pandas库。
import pandas (as pd)
导入时可指定别名,方便记忆与书写。
df
本文介绍了pandas库中的DataFrame结构,详细阐述了如何加载数据、查看行列和单元格信息、数据分组与聚合操作,以及基本的绘图功能。pandas为数据分析提供了强大的工具,支持从文件读取数据并进行各种处理和可视化。
订阅专栏 解锁全文
15万+

被折叠的 条评论
为什么被折叠?



