一、 Python数据分析与展示
掌握表示、清洗、统计和展示数据的能力
主题思想
与一组数据相关的那些事儿:如何理解一组数据表达的含义
摘要:有损地提取数据特征的过程
内容组织
- 全课程包括:8个内容单元,共12个单元
- 全课程总长4周,每周3个单元
- 每周包含一个实战型实例
编辑工具
- 使用Anaconda IDE集成开发工具
- 需要理解和掌握如下工具的使用:
- conda
- Spyder
- IPython
实例
-
实例1:图像的手绘效果
-
实例2:引力波的绘制
-
实例3:房价趋势的关联因素分析
-
实例4:股票数据的趋势分析曲线
-
坐标系的绘制
-
饼图的绘制
-
直方图的绘制
-
极坐标图的绘制
-
散点图的绘制
二、Anaconda IDE 的基本使用
Anaconda
包管理和环境管理工具:conda
conda:
一个工具,用于包管理和环境管理,其中:
包管理与pip类似,管理Python第三方库
环境管理能够允许用户使用不同版本Python,并能灵活切换
anaconda:
一个集合,包括conda、某版本Python、一批第三方库等
conda将工具、第三方库、Python版本、conda都当作包,同等对待
Win平台: cmd
,执行 conda ‐‐version 获取conda版本
执行 conda update conda 升级conda
编程工具:Spyder
交互式编程环境:IPython
%run的命令
%魔术命令
三、NumPy库入门
数据的维度
从一个数据到一组数据
维度:一组数据的组织形式
一维数据
一维数据由对等关系的有序或无序数据构成,采用线性方式组织
对应列表、数组和集合等概念
列表和数组
一组数据的有序结构
区别
列表:数据类型可以不同
数组:数据类型相同
二维数据
二维数据由多个一维数据构成,是一维数据的组合形式
表格是典型的二维数据
其中,表头是二维数据的一部分
多维数据
多维数据由一维或二维数据在新维度上扩展形成
高维数据
高维数据仅利用最基本的二元关系展示数据间的复杂结构
数据维度的Python表示
数据维度是数据的组织形式
数据维度的Python表示
数据维度是数据的组织形式
NumPy的数组对象:ndarray
NumPy
NumPy是一个开源的Python科学计算基础库,包含:
-
一个强大的N维数组对象 ndarray
-
广播功能函数
-
整合C/C++/Fortran代码的工具
-
线性代数、傅里叶变换、随机数生成等功能
NumPy是SciPy、Pandas等数据处理或科学计算库的基础
NumPy的引用
N维数组对象:ndarray
ndarray是一个多维数组对象,由两部分构成:
- 实际的数据
- 描述这些数据的元数据(数据维度、数据类型等)
ndarray数组一般要求所有元素类型相同(同质),数组下标从
0开始
ndarray实例
ndarray对象的属性
ndarray实例
ndarray数组的元素类型
ndarray为什么要支持这么多种元素类型?
对比:
Python语法仅支持整数、浮点数和复数3种类型
- 科学计算涉及数据较多,对存储和性能都有较高要求
- 对元素类型精细定义,有助于NumPy合理使用存储空间并优化性能
- 对元素类型精细定义,有助于程序员对程序规模有合理评估
非同质的ndarray对象
ndarray数组的创建
ndarray数组的创建方法
- 从Python中的列表、元组等类型创建ndarray数组
- 使用NumPy中函数创建ndarray数组,如:arange, ones, zeros 等
- 从字节流(raw bytes)中创建ndarray数组
- 从文件中读取特定格式,创建ndarray数组
(1)从Python中的列表、元组等类型创建ndarray数组
2)使用NumPy中函数创建ndarray数组,如:arange, ones, zeros等
2)使用NumPy中函数创建ndarray数组,如:arange, ones, zeros
3)使用NumPy中其他函数创建ndarray数组
ndarray数组的变换
ndarray数组的维度变换
a = np.ones((2,3,4), dtype=np.int32)
a = np.ones((2,3,4), dtype=np.int32)
ndarray数组的维度变换
a = np.ones((2,3,4), dtype=np.int32)
ndarray数组的类型变换
new_a = a.astype(