Python数据可视化分析与应用
- 标题 : Python数据可视化分析与应用
- 起源: 这不要期末复习了嘛,其实这节课挺有趣的,而且发现我的很长时间都花在学习 理论上和配置环境上,没有拿出时间来敲打代码 - 所以以后还是要在百忙之中抽空写代码 写个文档
- 更新时间如下 (如下)
- 创立时间: 2021 5 28 (1:34
- 第 5次更新 更新内容 Pandas 高级索引
- 最近更新时间 : 2021 5 30
- 更新内容:科学计算库(Numpy)2.4 数组运算
- 下次更新:
前言 : 通用型代码块
pd.DataFrame
df = pd.DataFrame({'A':['5','6','7'],'B':['5','6','7'],'C':['5','6','7']})
第二章 科学计算库NumPy
认识Numpy对象
创建NumPy对象
二维数组
2.3 ndarray数据类型
查看数据类型:
转换数据类型:
2.4 数组运算
数组运算
数组广播
矢量化运算
数组与标量间的运算
2.5 ndarray的索引和切片
整片索引的基本内容
花式(数组)索引基本使用:
2.6 数组的转置和轴对称
2.7 NumPy通用函数
:
2.8 利用NumPy进行数组处理
2.8.1 将条件逻辑转为数组运算
2.8.2 数组统计运算
2.8.3 数组排序
2.8.4 检查数组元素
2.8.5 唯一化及其他集合逻辑
2.9 线性代数模块:
2.10 随机数模块:
2.11 案例 —— 酒鬼漫步
第三章 数据分析工具 Pandas
3.1 Pandas的数据结构分析
3.1.1 Series
3.1.2 DataFrame
3.2 Pandas 索引操作以及高级索引
3.2.1 索引对象:
3.2.2 重置索引 :
3.2.3 索引操作 :
1 .Series的索引操作
2 .DataFrame的索引操作
扩展 : 使用 Pandas提供的方法操作索引
3.3 算术运算 与数据对齐
、
3.4 数据排序
3.4.2 按值排序
3.5 统计与描述
3.5 统计与描述
3.6 层次化索引
3.6.1 认识层次化索引
第四章 数据预处理
4.1 数据清洗
4.1.1 空值和缺失值的处理
1. isnull函数
2. notnull函数
3. dropna()方法
4. 填补缺失值 / 空值
4.1.2 重复值的处理
4.1.3 异常值的处理
1. 基于u- 36原则检测异常值
2.基于箱型图检测异常值
4.1.4 更改数据类型
1.明确指定数据类型
2. 通过astype()方法强制转换数据的类型
3. 通过 to_numeric()函数转换数据类型
4.2 数据合并
4.2.1 轴向堆叠数据
1. 横向堆叠与外连接 :
纵向堆叠数据
4.2.2. 主键合并数据 :
4.2.3. 根据行索引合并数据 :
重叠列名 on
Z