Numpy中文指南:基本操作

本文是NumPy中文指南,介绍了NumPy的基本操作,包括创建、转化、操作数组,以及索引、切片、统计计算等功能。NumPy作为Python科学计算库,提供高效的数组处理和丰富的数学函数,简化了科学计算中的循环和数据处理。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1、简介

Python是一种流行的通用编程语言,在科学领域被广泛使用。你很容易在Python代码中调用以前的C、Fortran或者R代码。Python是面向对象语言,比C和Fortran更加高级。使用Python可以写出易读、整洁并且缺陷最少的代码。然而,Python本身并不具有与Matlab等效的功能块,而这恰恰就是NumPy存在的意义。除NumPy以外,相关的Python科学计算库还有,SciPy和Matplotlib。ipython是一个净强化的交互Python Shell,对探索NumPy的特性非常方便;matplotlib将允许你绘图;Scipy在NumPy的基础上提供了很多科学模块;

 NumPy(Numerical Python的缩写)是一个开源的Python科学计算库。使用NumPy,就可以很自然地使用数组和矩阵。NumPy包含很多实用的数学函数,涵盖线性代数运算、傅里叶变换和随机数生成等功能。如果你的系统中已经装有LAPACK,NumPy的线性代数模块会调用它,否则NumPy将使用自己实现的库函数。LAPACK是一个著名的数值计算库,最初是用Fortran写成的,Matlab同样也需要调用它。从某种意义上讲,NumPy可以取代Matlab和Mathematica的部分功能并且允许用户进行快速的交互式原型设计

NumPy能够直接对数组和矩阵进行操作,可以省略很多循环语句,其众多的数学函数也会让编写代码的工作轻松许多;了NumPy的两个特性:向量化(Vectorization)广播(Broadcasting),它们是NumPy强大之处的基础。

向量化用于描述任何缺失的显式循环、索引及其它,在代码这些事情是即时发生;一般来说,NumPy中所有操作,并不只是算术运算,还有逻辑运算,位运算,函数运算等,以这种隐式的元素层面的方式执行,就是广播。

NumPy中数组的存储效率和输入输出性能均远远优于Python中等价的基本数据结构;NumPy数组的通用性不及Python提供的list容器,这是其不足之处;

NumPy的大部分代码都是用C语言写成的,这使得NumPy比纯Python代码高效得多;

列表操作:

c = []
for i in range(len(a)):
    c.append(a[i]*b[i])

 C语言,一维数组:

for (i = 0; i < rows; i++)
{c[i] = a[i]*b[i];}

  C语言,二维数组:

for (i = 0; i < rows; i++)
{
    for (j = 0; j < columns; j++)
    {
        c[i][j] = a[i][j]*b[i][j];
    }
}

Numpy,

c = a * b

2、Numpy函数总览

创建数组:

arange, array, copy, empty, empty_like, eye, fromfile, fromfunction, identity, linspace, logspace, mgrid, ogrid, ones,ones_like, r , zeros, zeros_like

转化:

astype, atleast 1d, atleast 2d, atleast 3d, mat

操作:

array split, column stack, concatenate, diagonal, dsplit, dstack, hsplit, hstack, item, newaxis, ravel, repeat, reshape,resize, squeeze, swapaxes, take, transpose, vsplit, vstack

询问:

all, any, nonzero, where

排序:

argmax, argmin, argsort, max, min, ptp, searchsorted, sort

运算:

choose, compress, cumprod, cumsum, inner, fill, imag, prod, put, putmask, real, sum

基本统计:

cov, mean, std, var

基本线性函数:

cross, dot, outer, svd, vdot

3、基础操作

3-1 ndarray:

在NumPy中维度(dimensions)叫做轴(axes),轴的个数叫做秩(rank)。注意numpy.array和标准Python库类array.array并不相同,后者只处理一维数组和提供少量功能。

属性有:ndarray.ndim(秩),ndarray.shape(维度,这是一个指示数组在每个维度上大小的整数元组),ndarray.size(数组元素的总个数,等于shape属性中元组元素的乘积),ndarray.dtype(用来描述数组中元素类型的对象),ndarray.itemsize(数组中每个元素的字节大小),ndarray.data(实际数组元素的缓冲区)

3-2 创建数组:

a = array([2,3,4])
b = array( [ (1.5,2,3), (4,5,6) ] )
zeros( (3,4) )
ones( (2,3,4), dtype=int16 )
empty( (2,3) )
arange( 10, 30, 5 )

当arange使用浮点数参数时,由于有限的浮点数精度,通常无法预测获得的元素个数。因此,最好使用函数linspace去接收我们想要的元素个数来代替用range来指定步长。其它函数array, zeros, zeros_like, ones, ones_like, empty, empty_like, arange, linspace, rand, randn, fromfunction, fromfile。

3-3 打印数组:

a = arange(6) 
print(a)
b = arange(12).reshape(4,3) 
print(b)
c = arange(24).reshape(2,3,4)
print(c)

3-4 基本运算:

a = array( [20,30,40,50] )
b = arange( 4 )
c = a - b
b ** 2
10 * sin( a )
>>> a < 35 
array([True, True, False, False], dtype=bool

 矩阵乘法:

A = array( [[1,1],
            [0,1]] )
B = array( [[2,0],
            [3,4]] )
C = A * B
dot(A, B)

改变矩阵的值:

a = ones((2,3), dtype=int)
b = random.random((2,3))
a *= 3
b += a
a += b
a = ones(3, dtype=int32)
b = linspace(0, pi, 3)
c = a + b
d = exp(c*1j)
d.dtype.name

数组累加:

a = random.random((2,3))
a.sum()
a.min()
a.max()

 数组轴操作:

b = arange(12).reshape(3,4)
b.sum(axis=0) # 每列相加
b.min(axis=1) # 每行最小
b.cumsum(axis=1) # 按行累计

3-5 通用函数:

all, alltrue, any, apply along axis, argmax, argmin, argsort, average, bincount, ceil, clip, conj, conjugate, corrcoef,
cov, cross, cumprod, cumsum, diff, dot, floor, inner, inv, lexsort, max, maximum, mean, median, min, minimum, nonzero,
outer, prod, re, round, sometrue, sort, std, sum, trace, transpose, var, vdot, vectorize, where。

3-6 索引,切片和和迭代:

一维数组:

a = arange(10)**3
a[2]
a[2:5]
a[:6:2] = -1000 # from start to position 6, exclusive, set every 2nd element to - 1000
a[ : :-1] # reversed a

二维数组:

def f(x,y):
    return 10 * x + y

>>> b = fromfunction(f,(5,4),dtype=int)
array([[ 0, 1, 2, 3],
            [10, 11, 12, 13],
            [20, 21, 22, 23],
            [30, 31, 32, 33],
            [40, 41, 42, 43]])
b[2,3]
>>> b[0:5, 1]    # each row in the second column of b
array([ 1, 11, 21, 31, 41])
>>> b[ : ,1]     # equivalent to the previous example of b
array([ 1, 11, 21, 31, 41])
>>> b[-1]        # the last row. Equivalent to b[-1,:]
array([40, 41, 42, 43])

"""
如果x是秩为5的数组(即它有5个轴),那么:
x[1,2,…] 等同于 x[1,2,:,:,:],
x[…,3] 等同于 x[:,:,:,:,3]
x[4,…,5,:] 等同 x[4,:,:,5,:]
"""

c = array( [[[ 0, 1, 2], [ 10, 12, 13]],
            [[100,101,102],[110,112,113]] ] )
>>> c.shape
(2, 2, 3)
>>> c[1,...]
array([[100, 101, 102],[110,112,113]])
>>> c[...,2]
array([[ 2, 13], [102, 113]])
迭代多维数组是就第一个轴而言的:[2](0轴)
>>> for row in b:
    print row
[0 1 2 3][10 11 12 13][20 21 22 23][30 31 32 33][40 41 42 43]

>>> for element in b.flat:
    print element
0 1 2 3 10 11 12 13 20 21 22 23 30 31 32 33 40 41 42 43

3-7 更改数组的形状

>>> a = floor(10*random.random((3,4)))
>>> a
array([[ 7., 5., 9., 3.],[ 7., 2., 7., 8.],[ 6., 8., 3., 2.]])
>>> a.shape
(3, 4)
>>> a.ravel() # flatten the array
array([ 7., 5., 9., 3., 7., 2., 7., 8., 6., 8., 3., 2.])
>>> a.shape = (6, 2)
>>> a.transpose()
array([[ 7., 9., 7., 7., 6., 3.],[ 5., 3., 2., 8., 8., 2.]])
array([[ 7., 5.],[ 9., 3.],[ 7., 2.],[ 7., 8.],[ 6., 8.],[ 3., 2.]])
>>> a.resize((2,6))
>>> aarray([[ 7., 5., 9., 3., 7., 2.],[ 7., 8., 6., 8., 3., 2.]])

3-8 组合不同的数组

垂直和水平

>>> a = floor(10*random.random((2,2)))
>>> a
array([[ 1., 1.],[ 5., 8.]])
>>> b = floor(10*random.random((2,2)))
>>> b
array([[ 3., 3.],[ 6., 0.]])
>>> vstack((a,b))
array([[ 1., 1.],[ 5., 8.],[ 3., 3.],[ 6., 0.]])
>>> hstack((a,b))
array([[ 1., 1., 3., 3.],[ 5., 8., 6., 0.]])

column_stack:函数column_stack以列将一维数组合成二维数组

>>> column_stack((a,b)) # With 2D arrays
array([[ 1., 1., 3., 3.],[ 5., 8., 6., 0.]])
>>> a=array([4.,2.])
>>> b=array([2.,8.])
>>> a[:,newaxis] # This allows to have a 2D columns vector
array([[ 4.],[ 2.]])
>>> column_stack((a[:,newaxis],b[:,newaxis]))
array([[ 4., 2.],[ 2., 8.]])
>>> vstack((a[:,newaxis],b[:,newaxis])) # The behavior of vstack is different
array([[ 4.],[ 2.],[ 2.],[ 8.]

3-9 分割数组

使用hsplit你能将数组沿着它的水平轴分割,或者指定返回相同形状数组的个数,或者指定在哪些列后发生分割:

>>> a = floor(10*random.random((2,12)))
>>> aarray([[ 8., 8., 3., 9., 0., 4., 3., 0., 0., 6., 4., 4.],
            [ 0., 3., 2., 9., 6., 0., 4., 5., 7., 5., 1., 4.]])
>>> hsplit(a,3) # Split a into 3
[   array([[ 8., 8., 3., 9.],[ 0., 3., 2., 9.]]), 
    array([[ 0., 4., 3., 0.],[ 6., 0., 4., 5.]]), 
    array([[ 0., 6., 4., 4.],[ 7., 5., 1., 4.]])]
>>> hsplit(a,(3,4)) # Split a after the third and the fourth column
[array([[ 8., 8., 3.],[ 0., 3., 2.]]), 
array([[ 9.],[ 9.]]), 
array([[ 0., 4., 3., 0., 0., 6., 4., 4.],[ 6., 0., 4., 5., 7., 5., 1., 4.]]

3-10复制和视图

不同的数组对象分享同一个数据。视图方法创造一个新的数组对象指向同一数据
>>> c = a.view()
>>> c is a
False
>>> c.base is a # c is a view of the data owned by aTrue
>>> c.flags.owndata
False
>>> c.shape = 2,6 # a's shape doesn't change
>>> a.shape(3, 4)
>>> c[0,4] = 1234 # a's data changes
>>> a
array([[ 0, 1, 2, 3],[1234, 5, 6, 7],[ 8, 9, 10, 11]

切片数组返回它的一个视图

>>> s = a[ : , 1:3] # spaces added for clarity; could also be written "s = a[:,1:3]"
>>> s[:] = 10 # s[:] is a view of s. Note the difference between s=10 and s[:]=10
>>> a
array([[ 0, 10, 10, 3],[1234, 10, 10, 7],[ 8, 10, 10, 11]

深复制

>>> d = a.copy() # a new array object with new data is created
>>> d is a
False
>>> d.base is a # d doesn't share anything with a
False
>>> d[0,0] = 9999
>>> a
array([[ 0, 10, 10, 3],[1234, 10, 10, 7],[ 8, 10, 10, 11]

 

说明:本文档所有内容来源于网络 https://www.numpy.org.cn/user/ 目录 1. NUMPY 介绍 1 1.1 什么是 NUMPY? 1 1.2 为什么 NUMPY 这么快? 3 1.3 还有谁在使用 NUMPY? 3 2. 快速入门教程 4 2.1 先决条件 4 2.2 基础知识 4 2.2.1一个例子 5 2.2.2 数组创建 6 2.2.3 打印数组 8 2.2.4 基本操作 10 2.2.5 通函数 13 2.2.6 索引、切片和迭代 14 2.3 形状操纵 18 2.3.1改变数组的形状 18 2.3.2 将不同数组堆叠在一起 20 2.3.3 将一个数组拆分成几个较小的数组 22 2.4 拷贝和视图 23 2.4.1 完全不复制 23 2.4.2 视图或浅拷贝 24 2.4.3 深拷贝 25 2.4.4 功能和方法概述 26 2.5 LESS 基础 26 广播(Broadcasting)规则 27 2.6 花式索引和索引技巧 27 2.6.1使用索引数组进行索引 27 2.6.2使用布尔数组进行索引 31 2.6.3 ix_()函数 34 2.6.4使用字符串建立索引 37 2.7线性代数 37 简单数组操作 37 2.8技巧和提示 38 2.8.1“自动”整形 39 2.8.2矢量堆叠 39 2.8.3直方图 40 2.9进一步阅读 41 3. NUMPY 基础知识 42 3.1 数据类型 42 3.1.1 数组类型之间的转换 42 3.1.2 数组标量 45 3.1.3 溢出错误 46 3.1.4 扩展精度 47 3.2 创建数组 47 3.2.1 简介 48 3.2.2 将Python array_like对象转换为Numpy数组 48 3.2.3 Numpy原生数组的创建 48 3.2.4 从磁盘读取数组 50 3.3 NUMPY与输入输出 51 3.3.1 定义输入 51 3.3.2 将行拆分为列 52 3.3.3 跳过直线并选择列 54 3.3.4 选择数据的类型 55 3.3.5 设置名称 56 3.3.6 调整转换 59 3.3.7 快捷方式函数 62 3.4 索引 62 3.4.1 赋值与引用 63 3.4.2 单个元素索引 63 3.4.3 其他索引选项 64 3.4.4 索引数组 65 3.4.5 索引多维数组 66 3.4.6 布尔或“掩码”索引数组 67 3.4.7 将索引数组与切片组合 69 3.4.8 结构索引工具 70 3.4.9 为索引数组赋值 71 3.4.10 在程序中处理可变数量的索引 72 3.5 广播 73 3.6 字节交换 78 3.6.1字节排序和ndarrays简介 78 3.6.2 更改字节顺序 80 3.7 结构化数组 82 3.7.1 介绍 82 3.7.2 结构化数据类型 83 3.7.3 索引和分配给结构化数组 88 3.7.4 记录数组 96 3.7.5 Recarray Helper 函数 98 3.8编写自定义数组容器 116 3.9子类化NDARRAY 124 3.9.1 介绍 124 3.9.2 视图投影 125 3.9.3 从模板创建 126 3.9.4 视图投影与从模板创建的关系 126 3.9.5 子类化的含义 126 3.9.6 简单示例 —— 向ndarray添加额外属性 132 3.9.7 稍微更现实的例子 —— 添加到现有数组的属性 134 3.9.8 __array_ufunc__ 对于ufuncs 135 3.9.9 __array_wrap__用于ufuncs和其他函数 139 3.9.10 额外的坑 —— 自定义的 __del__ 方法和 ndarray.base 142 3.9.11 子类和下游兼容性 143 4. 其他杂项 144 4.1 IEEE 754 浮点特殊值 144 4.2 NUMPY 如何处理数字异常的 146 4.3 示例 146 4.4 连接到 C 的方式 147 4.4.1 不借助任何工具, 手动打包你的C语言代码。 147 4.4.2 Cython 148 4.4.3 ctypes 148 4.4.4 SWIG(自动包装发生器) 149 4.4.5 scipy.weave 149 4.4.6 Psyco 149 5. 与MATLAB比较 149 5.1 介绍 150 5.2 一些关键的差异 150 5.3 'ARRAY'或'MATRIX'?我应该使用哪个? 151 5.3.1 简答 151 5.3.2 长答案 151 5.4 MATLAB 和 NUMPY粗略的功能对应表 153 5.4.1 一般功能的对应表 153 5.4.2 线性代数功能对应表 154 5.5 备注 161 5.6 自定义您的环境 163 5.7 链接 164 6. 从源代码构建 164 6.1 先决条件 164 6.2 基本安装 164 6.3 测试 165 并行构建 165 6.4 FORTRAN ABI不匹配 165 6.4.1 选择fortran编译器 166 6.4.2 如何检查BLAS / LAPACK /地图集ABI 166 6.5 加速BLAS / LAPACK库 166 6.5.1 BLAS 166 6.5.2 LAPACK 167 6.5.3 禁用ATLAS和其他加速库 167 6.6 提供额外的编译器标志 168 6.7 使用ATLAS支持构建 168 7. 使用NUMPY的C-API 168 7.1 如何扩展NUMPY 168 7.1.1 编写扩展模板 169 7.1.2 必需的子程序 169 7.1.3 定义函数 171 7.1.4 处理数组对象 175 7.1.5 示例 180 7.2 使用PYTHON作为胶水 182 7.2.1 从Python调用其他编译库 183 7.2.2 手工生成的包装器 183 7.2.3 f2py 184 7.2.4 用Cython 191 7.2.5 ctypes 196 7.2.6 您可能会觉得有用的其他工具 206 7.3 编写自己的UFUNC 208 7.3.1 创建一个新的ufunc 208 7.3.2 示例非ufunc扩展名 209 7.3.3 一种dtype的NumPy ufunc示例 215 7.3.4 示例具有多个dtypes的NumPy ufunc 221 7.3.5 示例具有多个参数/返回值的NumPy ufunc 230 7.3.6 示例带有结构化数组dtype参数的NumPy ufunc 235 7.4 深入的知识 241 7.4.1 迭代数组中的元素 242 7.4.2 用户定义的数据类型 246 7.4.3 在C中对ndarray进行子类型化 249
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值