(未完)
第一章 Numpy & Pandas 简介
1.1 Why Numpy & Pandas?
采用矩阵运算,运算速度快,占用资源少,比python自带的字典或者列表要快很多;numpy是采用C语言编写的,而pandas又是基于numpy编写的升级版。
1.2 Numpy 和 Pandas 安装
sudo apt-get install python-numpy
sudo apt-get install python-pandas
第二章 Numpy 学习
2.1 Numpy 属性
array 数组:可生成数组或矩阵
ndim
shape
size
import numpy as np
array = np.array([[1,2,3],[4,5,6]])
print(array)
print(array.ndim) #维度dimenion:几维 2
print(array.shape) #形状:行数和列数 (2,3)
print(array.size) #元素个数 6
2.2 Numpy 的创建 array
array
dtype
zeros
ones
empty
arange
linspace
import numpy as np
a = np.array([[1,2,3],
[4,5,6]])
print(a)
a = np.array([[1,2,3],[4,5,6]],dtype=np.int) #制定数据的类型 对于array,是dtype,而numpy的常用数据类型有两种:int和float,一般有int16 int32 int64,float同样,数值越大占用内存越大,精度也就越高,但是单位内存下存储的东西也就越少
print(a.dtype) #python3.5及以下版本默认类型为64,python3.6默认为32
a = np.zeros((3,4)) #生成3行4列元素全为0的矩阵
print(a)
a = np.ones((3,4),dtpye = np.float32) #生成3行4列元素全为1的矩阵,并规定数据类型为float32
print(a)
print(a.dtype)
a = np.empty((3,4)) #生成3行4列且每个元素都接近0的矩阵,据说在python3.6中和zeros是一样的了,未查证
print(a)
#生成等差数列的两个方法:
a = np.arange(10,20,2) #生成连续的数组,从10到20(不包括20),**步长为2**
print(a)
a = np.linspace(10,20,5) #创建线段型数据 从10到20(包括20),**元素个数为5**
print(a)
a = np.linspace(10,20,num=50, endpoint=True, retstep=False, dtype=None)
print(a)
a = np.linspace(1,10,5).reshape((5,4)) #改变矩阵的形状,变为5行4列的矩阵
print(a)
函数arange()与linspace()的区别
np.arange(start,stop,step)
生成一个[start,stop) 左闭右开步长为step的一维数组。
np.linspace(start,stop,num=40, endpoint=True, retstep=False, dtype=None)
生成一个[start,stop]左右均闭的等差数列,元素个数num默认为50个,endpoint=True默认包含stop, retstep=False默认不显示步长, dtype=None默认不改变数据类型。
2.3 Numpy 基础运算1
import numpy as np
a = np.array([5,