多维矩阵乘积运算和对应的广播机制

最新推荐文章于 2025-10-14 16:09:55 发布

原创最新推荐文章于 2025-10-14 16:09:55 发布 · 457 阅读

2 ·

CC 4.0 BY-SA版权

文章标签：

#矩阵 #深度学习 #线性代数

神经网络中的多维矩阵乘积运算：
![在这里插入图片描述](https://i-blog.csdnimg.cn/direct/5eba4ad75e0a46938e92b671e66e4632.png

遵循的原则是：两张量前两维度应该是相同的，如果不同则其中一张量维度为1。

如果有论文中有遇到矩阵乘积的两项维度不一致，那就考虑它计算时是使用了广播机制（如YOLACT）。
例如：
tensor1 = torch.randn(2, 3, 4, 5) # 2x3x4x5
tensor2 = torch.randn(2, 1, 5, 6) # 2x3x5x6

所有大于二维的，最终都是以二维为基础堆叠在一起的！！所以在矩阵运算的时候，其实最后都可以转成我们常见的二维矩阵运算。

例子：四维*四维
比如a：shape=[2,1,4,5]，b：shape=[1,1,5,4]相乘，输出的结果中，前两维保留的是[2,1]，最终结果shape=[2,1,4,4]

后两维[4,4]理解为利用a中shape[4,5]的矩阵乘b中shape[5,4]的矩阵得到。得到的乘积结果前面的维度为[2,1]的原因是：a前面的维度为[2,1]，但b只有[1,1]，所以看成b进行了广播得到，但前面的维度满足用广播机制的前提就是有一个维度为1。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

feifeidata

关注关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

探索 Python 领域中 NumPy 的广播机制

Python编程之道的博客

04-09

934

NumPy作为Python科学计算的基础库，其广播机制是实现高效数组运算的关键特性。本文旨在全面解析广播机制的工作原理、应用场景和性能特点，帮助读者深入理解并有效利用这一强大功能。文章将从广播机制的基本概念入手，逐步深入其实现原理和底层机制，然后通过实际代码示例展示各种应用场景，最后讨论性能优化和最佳实践。广播(Broadcasting): NumPy中不同形状数组进行算术运算的机制数组(Array): NumPy中的多维同构数据容器形状(Shape): 描述数组各维度大小的元组轴(Axis)

【深度学习】— 线性代数基础-标量、向量、矩阵、张量、张量算法的基本性质、按元素运算示例、Hadamard积、标量与张量运算、广播机制、降维、点积、矩阵-向量积、矩阵-矩阵乘法、范数

我们都是被分成两半的人，一边热爱生活，一边憎恨生活。面对生活，我们总是在矛盾的两端摇摆，在反复的矛盾和犹豫中，一边踉跄前行，一边重振旗鼓。我渴望改变，渴望变得更好，渴望找到出口……就像一个溺水人的挣扎，就像一个救生圈。我是一个矛盾集合体，想要变得快乐，但是

09-27

1697

标量、向量、矩阵和张量是线性代数中的基本数学对象。向量是对标量的泛化，矩阵是对向量的泛数。标量、向量、矩阵和张量分别具有零、一、二和任意数量的轴。通过sum和mean函数，张量可以沿指定轴降低维度。两个矩阵的按元素乘法称为Hadamard积，它与矩阵乘法不同。在深度学习中，常用的范数包括L1范数、L2范数和Frobenius范数。我们可以对标量、向量、矩阵和张量执行各种操作。

参与评论您还未登录，请先登录后发表或查看评论

多维数据运算(矩阵乘法)

disanda的专栏

09-20

2267

很多人把线性代数中的矩阵乘法在编程中搞复杂了，这里说明如下：多维数据一般是用np运算，乘法可简单分为元素乘积和矩阵乘积 1. 元素乘积这个简单，符号为：A*B，即对应元素相乘，这个必须保证矩阵维度相同, 即 A.shape = B.shape import numpy as np A = np.random.randn(2,2) # shape:[2,2] print(A) print(A*A) 2.矩阵运算类似线性代数中的矩阵乘积 (行列乘积等于新矩阵的一个元素)，计算符号包括4个： A@B

多维矩阵相乘

u011830148的博客

09-25

4529

实践发现：除了最后两维，其它维的宽度都要相同，实际上也只是最后两个维度相乘。

3多维数组的矩阵乘法

最新发布

qq_42217078的博客

10-14

216

NumPy 是 Python 中最基础也是最重要的科学计算库之一，它提供了高性能的多维数组对象和各种数学函数。

[tensorflow] 多维矩阵的乘法

currycode

04-29

1万+

矩阵乘法本质上只能是两个二维的matrix进行叉乘，那么两个三维甚至四维的矩阵相乘是怎么做到的呢？比如： import tensorflow as tf a = tf.constant(1,2,3,4) b = tf.constant(1,2,4,6) c = tf.matmul(a,b) # c.shape == (1,2,3,6) 查看matmul的源码： @tf_export(...

多维矩阵乘法与逐点相乘

qq_46354201的博客

12-08

725

在 NumPy 或类似的数组操作库中，多维矩阵乘法是按照最后两个维度进行的。这被称为 "最后两维矩阵乘法规则" 或 "尾部维度矩阵乘法规则"。需要注意的是，这个规则只适用于矩阵乘法，而不是元素级别的乘法。如果你需要执行元素级别的乘法，可以使用。，它们满足矩阵乘法的要求，因此得到的结果是一个形状为。在这种情况下，可以使用。例如，考虑两个三维数组。

多维数组综合应用第1关：矩阵乘法

HaKuShioyo的博客

03-23

1543

任务描述本关任务：编写一个程序，输入两个矩阵输出矩阵乘的结果。矩阵乘法矩阵相乘最重要的方法是一般矩阵乘积。它只有在第一个矩阵的列数（ column ）和第二个矩阵的行数（ row ）相同时才有意义。矩阵乘法的定义如下：设A为 m×p 的矩阵，B为 p×n 的矩阵，那么称 m×n 的矩阵C为矩阵A与B的乘积，记作AB ，其中矩阵C中的第 i 行第 j 列元素可以表示为：矩阵乘法示例编程要求根据提示，在右侧编辑器补充代码，依次输入两个整数矩阵，输出矩阵乘法的结果，在输入矩阵时，

【无标题】python和Pytorch中的矩阵乘法运算总结

tanhongweibest的博客

12-14

1890

python 和Pytorch的矩阵乘法运算总结

Numpy指南：解锁Python多维数组与矩阵运算（上）

KevinRay_0854的博客

12-27

1318

NumPy（Numeric Python的缩写）是一个开源的Python科学计算库，用于进行大规模数值和矩阵运算。它是Python中用于科学计算的核心库之一，广泛应用于数据分析、机器学习、科学计算和工程应用等领域。numpy（Numeric Python）是python用于科学计算的基础包。特点是运行速度快，支持多维数组和向量化计算，实用的线性代数、基本统计运算、排序、选择、随机模拟、傅里叶变换等。

numpy数组运算与广播机制解析

[numpy数组运算与广播机制解析](https://img-blog.csdnimg.cn/4dc4d6d3b15e4ee59cda9f35c1b04d50.png) # 1. NumPy数组基础** NumPy是Python中用于科学计算的强大库，其中数组是其核心数据结构。NumPy数组是多维同质...

多维矩阵乘法：简单函数在多维数组中执行快速矩阵乘法。-matlab开发

05-30

mmat(A,B) 执行矩阵乘法，其中二维矩阵是多维数组的一部分。它相当于用于二维数组的内置 mtimes 函数的 Matlab。然而，它自然地扩展了 mtimes 函数，其中两个输入数组可以具有任意数量的额外维度。例如： A = [1 2;2 1]; B = [3 4; 1 2]; mmat(A,B) == mtimes(A,B) 但是 A 和 B 可以沿第 3 维展开： A = repmat([1 2; 2 1],[1 1 5]); C = mmat(A,B) 也可以执行，C 将包含： C(:,:,1) = A(:,:,1)*B; C(:,:,2) = A(:,:,2)*B; ... 在上面的示例中，B 沿着单例维度扩展以匹配 A 的乘法大小。在上面的例子中，矩阵乘法是沿着 A 和 B 的前两个维度执行的。但是当调用时： mmat(A,B,dim) 然后dim

使用Numpy/TensorFlow中的tensordot进行多维矩阵相乘

12-21

在使用Numpy或者TensorFlow的tensordot方法进行矩阵相乘的时候，axes是一个重要的参数，它可以定义两个矩阵互乘的时候是使用内积、外积、或是其他方法。不管Numpy还是TensorFlow，它们使用tensordot的axes参数的方法是一样的，本文在举例时混用了这两个函数，千万不要被迷惑。以TensorFlow的tensordot为例，其语法为： tf.tensordot( a, b, axes, name=None ) 其中a和b为输入的两个矩阵，参数axes定义了两个矩阵如何相乘。如设置“axes=0”的时候，就是计算a和b的外积（outer produ

向量化多维矩阵乘法：取任何 ND 矩阵并将其与另一个 ND 矩阵相乘，无需 For 循环-matlab开发

05-29

如果您想将多维矩阵相乘，而不必编写 for 循环来循环遍历超过两个的每个额外维度，则此例程适合您。在此例程的开发中没有使用单个 for 循环。因此，在使用此代码中包含的多维矩阵乘法运算时，您应该会看到显着的运行时改进。 mntimes 将支持 2-D 矩阵乘法，很像内置的 mtimes.m 例程（因此您可以根据需要重载它），它将支持 3-D 矩阵乘法、4-D 乘法等等（直到您用完系统内存）。矩阵的大小不必相同（即3x3 * 3x3），它们可以是1x3 * 3x1、1x3 * 3x3、3x3 * 3x1，选择是无限的，只要它是有效的二维操作即可。如果您确定确定哪个维度对应于行，哪个维度对应于列，则不应存在 ND 矩阵情况，此代码无法处理。示例函数调用： z = mntimes(x,y,xrowdim,xcoldim,yrowdim,ycoldim); 输入清单： x - ND 输入

n维矩阵乘法

12-11

n维矩阵乘法报告，帮助大家在临近期末时做课程设计报告，这是每个大学生的一大难题

torch中的矩阵乘法与广播机制

panghuzhenbang的博客

03-25

5140

几乎可用于计算所有矩阵/向量相乘的情况，支持broadcast操作，可以理解为torch.mm的broadcast版本，其乘法规则视参与乘法的两个张量的维度而定。特别的，针对多维数据 matmul()乘法，可以认为该 matmul()乘法使用两个参数的后两个维度来计算，其他的维度都可以认为是batch维度。用于计算矩阵和向量之间的乘法（矩阵在前，向量在后），不支持broadcast操作，要求矩阵与向量满足矩阵乘法的要求。用来计算两个向量的点积，不支持broadcast操作，要求两个一维张量的元素个数相同。

不同维度矩阵相乘

热门推荐

智国的博客

08-07

1万+

在深度学习中经常会遇到不同维度的矩阵相乘的情况，本文会通过一些例子来展示不同维度矩阵乘法的过程。总体原则：在高维矩阵中取与低维矩阵相同维度的分片来与低维矩阵相乘，结果再按分片时的顺序还原为高维矩阵。相乘结果的维度与原来的高维矩阵一致。二维乘一维三维乘一维三维乘二维 ...

多维矩阵的乘法的计算原理

sinat_40147910的博客

09-11

1327

tensorflow https://blog.youkuaiyun.com/zongza/article/details/89682862?utm_medium=distribute.pc_relevant_t0.none-task-blog-BlogCommendFromBaidu-1.edu_weight&depth_1-utm_source=distribute.pc_relevant_t0.none-task-blog-BlogCommendFromBaidu-1.edu_weight impo

Numpy矩阵运算规则

10-11

<think>首先，用户的问题是：“我想查找Numpy矩阵运算的规则请问Numpy矩阵运算规则”。用户提供了两个引用： - 引用[1]：提到在numpy中，* 以及加减乘除都表示元素之间的操作，矩阵的乘法要用dot()函数。 - 引用[2]：讨论了numpy中的矩阵乘法API，如np.matmul()和np.dot()，并给出了示例。用户指令要求： - 使用中文回答。 - 所有行内数学表达式使用$...$格式。 - 独立公式使用$$...$$格式并单独成段。 - LaTeX语法正确。 - 生成相关问题。 - 回答中引用的段落末尾自然地添加引用标识，如[^1]。 - 回答结构清晰，帮助用户逐步解决问题。 - 参考站内引用。用户上一次的问题是关于numpy矩阵运算的规则，所以我需要基于引用构建一个清晰的回答。关键点从引用中： - 在numpy中，运算符如 *, +, -, / 是元素级的操作（element-wise）。 - 矩阵乘法需要使用特定函数：np.dot() 或 np.matmul()。 - 引用[2]显示np.matmul()和np.dot()在二维矩阵上行为相似，但可能有差异。现在，构建回答： 1. **结构清晰**：逐步解决问题。先介绍基本概念，然后详细说明规则。 2. **步骤**： - 解释元素级操作 vs. 矩阵操作。 - 具体说明矩阵乘法的规则。 - 提供示例（参考引用中的代码）。 - 讨论np.dot()和np.matmul()的差异（基于常见知识，np.matmul()在Python 3.5+引入，更适合矩阵乘法）。 3. **使用LaTeX**： - 行内数学表达式：例如，元素级乘法表示为$a * b$。 - 独立公式：如果需要，定义矩阵乘法公式，如$C = A \cdot B$。 4. **引用**：在相关段落末尾添加引用标识。例如，提到元素级操作时引用[1]，提到矩阵乘法API时引用[2]。 5. **生成相关问题**：在回答结束时，生成2-3个相关问题。大纲回答： 1. **介绍**：简述numpy矩阵运算的基本规则。 2. **元素级操作**：解释运算符的行为。 3. **矩阵乘法**：详细介绍np.dot()和np.matmul()。 4. **总结**：概述规则。 5. **相关问题**：生成相关问题。确保LaTeX正确： - 行内：例如，$x * y$表示元素级乘法。 - 独立：如果有矩阵公式，例如： $$ C = A \times B $$ 但可能不需要，因为用户问题主要是规则描述。生成相关问题： - 基于主题，例如： 1. numpy中矩阵乘法np.dot()和np.matmul()的区别是什么？ 2. 如何在numpy中进行矩阵转置或逆？ 3. numpy数组和矩阵类的差异？最终回答： </think>### Numpy矩阵运算规则详解在NumPy中，矩阵运算规则与传统数学中的矩阵操作类似，但需特别注意其数组结构和API的差异。以下是基于您提供的引用和标准NumPy实践整理的核心规则，我将逐步解释关键点，确保结构清晰。 #### 1. **元素级运算规则** NumPy数组（`ndarray`）默认支持**元素级操作**（也称为逐元素操作）。这意味着运算符如 `+`, `-`, `*`, `/` 会对数组中对应位置的元素直接运算，而不涉及矩阵的整体结构。 - **规则说明**：给定两个数组 $A$ 和 $B$，运算 $A * B$ 表示每个元素相乘：如果 $A = [a_{ij}]$ 和 $B = [b_{ij}]$，则结果 $C = [a_{ij} \times b_{ij}]$。 - **示例**：如引用[1]所示，`A * B` 会计算元素积而非矩阵乘积： ```python import numpy as np A = np.array([[1, 1], [0, 1]]) B = np.array([[2, 0], [3, 4]]) print(A * B) # 输出: [[2, 0], [0, 4]] ``` 这适用于加法、减法等基本运算符[^1]。 #### 2. **矩阵乘法规则** 矩阵乘法（线性代数中的点积）需要使用专门的函数，因为运算符 `*` 不适用。NumPy提供两种主要API：`np.dot()` 和 `np.matmul()`。 - **规则说明**：给定矩阵 $A$（维度 $m \times n$) 和 $B$（维度 $n \times p$)，矩阵乘法 $C = A \times B$ 定义为： $$ c_{ij} = \sum_{k=1}^{n} a_{ik} \times b_{kj} $$ 其中 $C$ 的维度为 $m \times p$。这要求 $A$ 的列数等于 $B$ 的行数，否则报错。 - **API区别**： - `np.dot()`：支持多维数组的广义点积，但对二维矩阵效果与矩阵乘法一致。 - `np.matmul()`：专为矩阵乘法设计，在Python 3.5+推荐使用，行为更接近数学定义（例如，广播规则更严格）。 - **示例**：如引用[2]所示，两者在二维矩阵上结果相同： ```python a = np.array([[80, 86], [82, 80], [85, 78], [90, 90], [86, 82], [82, 90], [78, 80], [92, 94]]) b = np.array([[0.7], [0.3]]) print(np.dot(a, b)) # 输出: [[81.8], [81.4], ...] print(np.matmul(a, b)) # 输出相同结果 ``` 但对于更高维数组或有广播需求时，`np.matmul()` 更安全[^2]。 #### 3. **其他关键规则小结** - **维度兼容性**：所有二元运算要求数组形状兼容（可通过广播机制调整）。 - **函数替代运算符**：矩阵转置用 `.T`（如 `A.T`），矩阵逆用 `np.linalg.inv(A)`。 - **性能建议**：优先使用 `np.matmul()` 或 `@` 运算符（Python 3.5+的语法糖，如 `A @ B`）进行矩阵乘法，以提升代码可读性。 - **错误处理**：如果矩阵尺寸不匹配（如 $A$ 的列数 ≠ $B$ 的行数），NumPy会抛出 `ValueError`。通过以上规则，NumPy实现了灵活的矩阵运算，同时保持高性能。如果您有具体场景（如广播或多维数组），可进一步探讨。 #### 相关问题 1. NumPy中 `np.dot()` 和 `np.matmul()` 在三维数组上的区别是什么？ 2. 如何使用NumPy实现矩阵的逆或特征值分解？ 3. NumPy的广播机制在矩阵运算中如何工作？