Python数据分析与展示(三)—Pandas库

Pandas是一种高性能的数据分析库,提供Series和DataFrame两种核心数据结构,适用于复杂的数据操作和分析任务。它基于NumPy构建,与Matplotlib等工具配合使用,为Python数据科学生态提供了强大的支持。本文介绍了Pandas的基本用法,包括数据创建、索引、切片、算术运算和比较运算,以及数据类型操作如重排和索引调整。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Pandas—提高高性能易用数据类型和分析工具

引用

importpandas aspd

Pandas基于NumPy实现,常与NumPy和Matplotlib一同使用
在这里插入图片描述

两个数据类型—Series,DataFrame

Series类型

Series类型由一组数据及与之相关的数据索引组成
在这里插入图片描述
在这里插入图片描述
Series类型可以由如下类型创建:

  • Python列表 ,index与列表元素个数一致
  • 标量值 ,index表达Series类型的尺寸
  • Python字典 ,键值对中的“键”是索引,index从字典中进行选择操作
  • ndarray ,索引和数据都可以通过ndarray类型创建
  • 其他函数,range()函数等

Series类型的基本操作
Series类型包括index和values两部分
Series类型的操作类似ndarray类型
Series类型的操作类似Python字典类型

In [1]: import pandas as pd

In [2]: b = pd.Series([9,8,7,6],['a','b','c','d'])

In [3]: b
Out[3]:
a    9
b    8
c    7
d    6
dtype: int64

In [4]: b.index
Out[4]: Index(['a', 'b', 'c', 'd'], dtype='object')

In [5]: b.values
Out[5]: array([9, 8, 7, 6], dtype=int64)

In [6]: b['b']
Out[6]: 8

In [7]: b[1]
Out[7]: 8

In [8]: b[['c','d',0]]
Out[8]:
c    7.0
d    6.0
0    NaN
dtype: float64

In [9]: b[['c','d','a']]
Out[9]:
c    7
d    6
a    9
dtype: int64

Series类型的操作类似ndarray类型:
•索引方法相同,采用[]
•NumPy中运算和操作可用于Series类型
•可以通过自定义索引的列表进行切片
•可以通过自动索引进行切片,如果存在自定义索引,则一同被切片

DataFrame类型

DataFrame类型由共用相同索引的一组列组成
在这里插入图片描述
DataFrame类型可以由如下类型创建:

  • 二维ndarray对象
  • 由一维ndarray、列表、字典、元组或Series构成的字典
  • Series类型
  • 其他的DataFrame类型

DataFrame是二维带“标签”数组

DataFrame基本操作类似Series,依据行列索引

数据类型操作—改变Series和DataFrame对象

增加和重排—重新索引

.reindex()函数

.reindex(index=None, columns=None,…)的参数
在这里插入图片描述
在这里插入图片描述
删除指定索引对象

.drop()函数

.drop()能够删除Series和DataFrame指定行或列索引
在这里插入图片描述
算术运算
在这里插入图片描述
在这里插入图片描述
比较运算
在这里插入图片描述

像对待单一数据一样对待Series和DataFrame对象

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值