三、数据分析之概要(1)

1.pandas库的引用

Pandas是Python第三方库,提供高性能易用数据类型和分析工具
import pandas as pd
Pandas基于NumPy实现,常与NumPy和Matplotlib一同使用

测试

在这里插入图片描述

pandas库的理解

两个数据类型:Series, DataFrame
基于上述数据类型的各类操作
基本操作、运算操作、特征类操作、关联类操作
在这里插入图片描述

2.pandas库的Series类型

Series类型由一组数据及与之相关的数据索引组成
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

Series类型可以由如下类型创建:

  • Python列表
  • 标量值
  • Python字典
  • ndarray
  • 其他函数

在这里插入图片描述
在这里插入图片描述

  • Python列表,index与列表元素个数一致
  • 标量值,index表达Series类型的尺寸
  • Python字典,键值对中的“键”是索引,index从字典中进行选择操作
  • ndarray,索引和数据都可以通过ndarray类型创建
  • 其他函数,range()函数等

Series类型的基本操作

Series类型包括index和values两部分
Series类型的操作类似ndarray类型
Series类型的操作类似Python字典类型
在这里插入图片描述
在这里插入图片描述

Series类型的操作类似ndarray类型:

• 索引方法相同,采用[]
• NumPy中运算和操作可用于Series类型
• 可以通过自定义索引的列表进行切片
• 可以通过自动索引进行切片,如果存在自定义索引,则一同被切片
在这里插入图片描述

Series类型的操作类似Python字典类型:

• 通过自定义索引访问
• 保留字in操作
• 使用.get()方法
在这里插入图片描述
在这里插入图片描述

Series对象和索引都可以有一个名字,存储在属性.name中

在这里插入图片描述

Series对象可以随时修改并即刻生效

在这里插入图片描述

Series类型

在这里插入图片描述

2.pandas库的DateFream类型

DateFream类型

DataFrame类型由共用相同索引的一组列组成
在这里插入图片描述
在这里插入图片描述
DataFrame是一个表格型的数据类型,每列值类型可以不同
DataFrame既有行索引、也有列索引
DataFrame常用于表达二维数据,但可以表达多维数据

DataFrame类型可以由如下类型创建:

• 二维ndarray对象
• 由一维ndarray、列表、字典、元组或Series构成的字典
• Series类型
• 其他的DataFrame类型

从二维ndarray对象创建

在这里插入图片描述

从列表类型的字典创建

在这里插入图片描述
在这里插入图片描述

DateFream类型

在这里插入图片描述

3.pandas库的数据类型操作

重新索引

.reindex()能够改变或重排Series和DataFrame索引
在这里插入图片描述
在这里插入图片描述

索引类型

在这里插入图片描述
在这里插入图片描述

删除索引指定对象

在这里插入图片描述

4.pandas库的数据类型运算

算术运算法则

算术运算根据行列索引,补齐后运算,运算默认产生浮点数
补齐时缺项填充NaN (空)
二维和一维、一维和零维间为广播运算采用+ ‐*/符号进行的二元运算产生新的对象
在这里插入图片描述

方法形式的运算

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

比较运算法则

比较运算只能比较相同索引的元素,不进行补齐
二维和一维、一维和零维间为广播运算
采用

< >= <= == !=等符号进行的二元运算产生布尔对象
在这里插入图片描述
在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值