一 数据的维度
1. 分为一维数据(列表或集合)、二维数据(嵌套列表)、多维数据、高维数据(仅利用最基本的二元关系展示,如键值对或数据表示格式)
2.数据表示格式公认的有json,xml,yaml(鸭哞)
3. 列表里的元素类型可以不同,数据元素数据类型是相同的
二 numpy
(一)背景知识
是一个开源的python科学计算基础库。是SciPy,Pandas等数据处理或科学计算库的基础。
一个强大的N维数组对象ndarray
广播功能函数
线性代数、傅里叶变换、随机数生成等功能
1.有了列表为什么还要ndarray类型

(1)数组对象去掉元素间运算所需的循环,是一维向量更像单个数据
(2)提升运算速度
(3)数组对象采用相同的数据类型,有助于节省运算和存储空间(科学计算中一个维度的数据类型往往相同)
2.N维数组对象:ndarray
(1)ndarray是多维数组对象,由两部分构成:实际数据+描述数据的元数据(数据维度,数据类型)
import numpy as np
np.array()生成一个ndarray数组,ndarray在程序中的别名是array
np.array()输出成[]形式,元素由空格分割
(2)轴axis:保存 数据的维度,在轴上每个维度的数据存储在其中,一组数据看成'一个数据'是一个轴
秩rank:轴的数量,有多个维度
(3)
(4)数据类型
划分这么细的好处;
科学计算涉及数据多,对存储有要求,便于对程序规模合理评估
(5)ndarray一般要求数据是同质的,数据类型是一致的。
但也可以由非同质对象(数据类型不同或每个维度数据量不一致的时候)构成,这时返回的是对象类型,尽量避免使用
(二)ndarray数组的创建和变换
1.创建


2.变换
3.操作:索引,切片

(三)ndarray数组的运算
1.与标量的运算
2.一元函数
3.二元函数
把数组当成单个数
三 CSV文件(一二维数据的存取)
(一)从numpy创建csv

如
(二)把 csv读入numpy数组
如
(三)缺点
四 多维数据的存取
(一)数组存为文件

二进制文件比文本文件占用空间小,所以下载的数据集一般是二进制文件,只是当作数据备份的方式
(二)把文件还原成数组
(三)numpy的便捷文件存取,存储的文件扩展名为numpy专有的.npy,压缩扩展名为.npz
五 Numpy的随机数函数
