NumPy-1

莫熠夜

于 2024-10-21 17:11:07 发布

阅读量822

点赞数 17

文章标签： numpy

本文链接：https://blog.youkuaiyun.com/qq_64301528/article/details/143116586

版权

基础
- 概念
  - 全称是“ Numeric Python”，是 Python 的第三方扩展包，主要用来计算、处理一维或多维数组
  - 数组算术计算， NumPy 提供了大量的数学函数
  - 底层主要用 C语言编写，能够高速地执行数值计算
  - NumPy 还提供了多种数据结构，能应用在数组和矩阵的运算上
- 优点
  - 便捷高效地处理大量数据
    - NumPy 是 Python 科学计算基础库
    - NumPy 可以对数组进行高效的数学运算
    - NumPy 的 ndarray 对象可以用来构建多维数组
    - NumPy 能够执行傅立叶变换与重塑多维数组形状
    - NumPy 提供了线性代数，以及随机数生成的内置函数
- 与python列表区别
  - NumPy 数组是同质数据类型（homogeneous），即数组中的所有元素必须是相同的数据类型。数据类型在创建数组时指定，并且数组中的所有元素都必须是该类型。
    - NumPy 数组提供了丰富的数学函数和操作，如矩阵运算、线性代数、傅里叶变换等。
  - Python 列表是异质数据类型（heterogeneous），即列表中的元素可以是不同的数据类型。列表可以包含整数、浮点数、字符串、对象等各种类型的数据
    - Python 列表提供了基本的列表操作，如添加、删除、切片、排序等。
- 安装
  - pip install numpy -i https://pypi.tuna.tsinghua.edu.cn/simple/
ndarray
- NumPy 定义了一个 n 维数组对象，简称 ndarray 对象
  - 一个一系列相同类型元素组成的数组集合
  - 数组中的每个元素都占有大小相同的内存块，可以使用索引或切片的方式获取数组中的每个元素。
  - ndarray 对象采用了数组的索引机制，将数组中的每个元素映射到内存块上，并且按照一定的布局对内存块进行排列，常用的布局方式有两种，即按行或者按列。行：c语言，列：Forth语言
- 主要特点
  - 多维数组：ndarray 可以表示任意维度的数组，包括一维、二维、三维等。
  - 同质数据类型：ndarray 中的所有元素必须是相同的数据类型。
  - 高效内存布局：ndarray 在内存中是连续存储的，这使得数组的访问和操作非常高效。
  - 丰富的功能和方法：ndarray 提供了丰富的数学函数和操作，如矩阵运算、线性代数、傅里叶变换等。
- 使用方式
  - - ndarray 是通过 array 函数或其他 NumPy 函数（如 zeros、ones、arange 等）创建的。
  - - array 函数接受一个序列作为输入，并返回一个 ndarray 对象。
- array创建对象
  - 通过 NumPy 的内置函数 array() 可以创建 ndarray 对象，其语法格式如
    - numpy.array(object, dtype = None, copy = True, order = None,ndmin = 0)
- ndim指定/查看数组维度
  - 数组的维度就是一个数组中的某个元素，当用数组下标表示的时候，需要用几个数字来表示才能唯一确定这个元素，这个数组就是几维
    - 创建：numpy.array(object, ndmin = 0) 查看：numpy.ndim
- reshape数组变维
  - reshape() 函数允许你在不改变数组数据的情况下，改变数组的维度。
  - reshape() 返回的是一个新的数组，原数组不会被修改。reshape() 可以用于多维数组，例如将一个一维数组重塑为二维数组。
  - 元素总数必须匹配:新形状中的元素总数必须与原数组中的元素总数相同。
  - -1 作为占位符：你可以使用 -1 作为占位符，让 numpy 自动计算某个维度的大小。
  - reshape() 还可以将一维数组重塑为三维数组
数据类型
- NumPy 提供了比 Python 更加丰富的数据类型
  - 数据类型对象
    - 数据类型对象（Data Type Object）又称 dtype 对象，是用来描述与数组对应的内存区域如何使用。
    - 1.可以在创建数组时指定 dtype 参数来定义数组中元素的数据类型
    - 2.可以使用数组的 dtype 属性来获取数组中元素的数据类型
    - 3.可以使用 astype() 方法来转换数组中元素的数据类型。
  - 数据类型标识码
    - NumPy 中每种数据类型都有一个唯一标识的字符码，int8, int16, int32, int64 四种数据类型可以使用字符串 'i1', 'i2','i4','i8' 代替
    - NumPy 中常见的数据类型标识码及其对应的详细列表（int x i x/8）
- 在编程中，字节序标记用于指定数据的字节顺序。常见的字节序标记包括：
  - <: 小端序，数据的最低有效字节存储在内存的最低地址，而最高有效字节存储在内存的最高地址。
  - >: 大端序，数据的最高有效字节存储在内存的最低地址，而最低有效字节存储在内存的最高地址。
数组属性
- shape
  - 返回一个元组，元组中的每个元素表示数组在对应维度上的大小。元组的长度等于数组的维度数。
  - shape 属性功能：
    - 1. 未传入参数，返回一个由数组维度构成的元组
    - 2. 传入参数，可以用来调整数组维度的大小
  - 如果使用shape属性修改数组的形状，则修改的是原数组的形状，reshape修改数组的形状会返回一个新数组，不修改原数组的形状。
    - shape，查看数组 arr.shape，直接在元素组上修改形状，不返回新数组
- ndim
  - 返回的是数组的维数
    - 创建：numpy.array(object, ndmin = 0) 查看：numpy.ndim
- itemsize
  - itemsize 属性功能：
    - 返回数组中每个元素的大小（以字节为单位）
- flags
  - flags 属性功能：
    - 返回 ndarray 数组的内存信息
创建数组的其他方法
- 以下几个函数通常用于创建数字类型的数组，也可以用于创建布尔、字符串等类型的数组。但更适合用于创建数字数组。
- empty()
  - empty() 方法用来创建一个指定形状（shape）、数据类型（dtype）且未初始化的数组（数组元素为随机值）
  - 格式：
    - numpy.empty(shape, dtype = float, order = 'C')
- zeros()
  - 创建指定大小的数组，数组元素以 0 来填充
  - 格式：
    - numpy.zeros(shape, dtype = float, order = 'C')
- ones()
  - 创建指定形状的数组，数组元素以 1 来填充
  - 格式：
    - numpy.ones(shape, dtype = None, order = 'C')
- arange()
  - arange() 函数用于创建一个等差数列的数组。它类似于 Python 内置的 range() 函数，但返回的是一个 NumPy 数组而不是一个列表。
  - 格式：
    - numpy.arange(start, stop, step, dtype) 根据 start 与 stop 指定的范围以及 step 设定的步长，生成一个 ndarray。
  - 注意：
    - - arange() 函数生成的数组不包含 stop 值。
    - - 如果 step 为负数，则 start 必须大于 stop，否则生成的数组为空。
    - - arange() 函数在处理浮点数时可能会出现精度问题，因为浮点数的表示和计算存在精度误差。
- linspace
  - 在指定的数值区间内，返回均匀间隔的一维等差数组，默认均分 50 份
  - 格式：
    - np.linspace(start, stop, num=50, endpoint=True, retstep=False, dtype=None)
切片
- ndarray 对象的内容可以通过索引或切片来访问和修改，与 Python 中 list 的切片操作一样；
- slice()
  - 在 Python 中，slice 可以作为一个对象来使用。你可以创建一个 slice 对象，然后使用它来获取序列的片段。
  - 参数：
    - - start 是切片开始的位置（包含该位置）。
    - - stop 是切片结束的位置（不包含该位置）。
    - - step 是切片的步长，即选取元素的间隔。
  - slice 操作也可通过 [start:stop:step] 的形式来实现
  - 冒号 : 的作用
    - - 表示范围: 冒号用于表示一个范围。例如，array[1:3] 表示从索引 1 到索引 3（不包括 3）的元素。
    - - 表示所有元素: 单独使用冒号表示所有元素。例如，array[:, 1] 表示所有行的第 1 列。
    - - 步长: 双冒号后面可以跟一个步长值，表示每隔多少个元素取一个。例如，array[::2] 表示每隔一个元素取一个。
    - 注：冒号对于一维数组按索引号截取，二维数组按行和列截取。
  - 省略号 ... 的作用
    - - 表示所有维度: 省略号用于表示数组的所有维度。例如，array[..., 1] 表示取所有行的第 1 列。
    - - 简化多维切片: 在多维数组中，省略号可以简化切片操作，避免显式地写出所有维度的索引。
高级索引
- NumPy 中的高级索引指的是使用整数数组、布尔数组或者其他序列来访问数组的元素。相比于基本索引，高级索引可以访问到数组中的任意元素，并且可以用来对数组进行复杂的操作和修改。
- 整数数组索引
  - 整数数组索引是指使用一个数组来访问另一个数组的元素。这个数组中的每个元素都是目标数组中某个维度上的索引值。
- 布尔索引
  - 布尔索引通过布尔运算（如：比较运算符）来获取符合指定条件的元素的数组。
    - arr1=arr1[(arr1>5)]
- 逻辑运算符
  - - &：与运算，组合多个条件。
    - arr1=arr1[(arr1>5)&(arr1<8)]
  - - |：或运算，组合多个条件。
    - arr1=arr1[(arr1>5)|(arr1<8)]
  - - ~：非运算，取反条件。
广播
- 广播（Broadcast）是 numpy 对不同形状（shape）的数组进行数值计算的方式，对数组的算术运算通常在相应的元素上进行。这要求维数相同，且各维度的长度相同，如果不相同，可以通过广播机制，这种机制的核心是对形状较小的数组，在横向或纵向上进行一定次数的重复，使其与形状较大的数组拥有相同的维度。
- - 1. 维度匹配：如果两个数组的维度数不同，维度数较少的数组会在前面补上长度为 1 的维度。
  - 2. 长度匹配：如果两个数组在某个维度上的长度不同，但其中一个数组在该维度上的长度为 1，则该数组会沿着该维度进行广播。
  - 3. 不匹配：如果两个数组在某个维度上的长度既不相同也不为 1，则广播失败，抛出 ValueError。
- 一/多维数组和标量相加：可以理解为将标量值扩充为和一/多维数组元素数量相同的数组，然后进行对应位置的元素相加
- 多维数组与一维数组相加（前提：一维数组和多维数组的行/列相同）：可以理解为将一维数组行/列分别与多维数组的行/列相加