torch.matmul的前后两个矩阵维度不同的小结

系列文章目录

本系列记录自己的代码学习知识



前言


一、torch.matmul()

torch.matmul()也是一种类似于矩阵相乘操作的tensor联乘操作。但是它可以利用python 中的广播机制,处理一些维度不同的tensor结构进行相乘操作。这也是该函数与torch.bmm()区别所在。

torch.matmul(input,other)#我们现以不同的名字区分前后两个矩阵

来源
作者:top_小酱油
链接:https://www.jianshu.com/p/e277f7fc67b3
来源:简书
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

二、详解解释

1.input维度比other大

例如:

n = ([1,2,3],[1,2,3])
### torch.matmul 对三维矩阵的操作 `torch.matmul` 是 PyTorch 中的一个通用矩阵乘法函数,能够处理不同维度的张量。对于三维矩阵而言,它会按照批量的方式执行矩阵乘法。 #### 示例代码 以下是 `torch.matmul` 处理三维矩阵的具体示例: ```python import torch # 定义两个三维张量 (batch_size=2, n=3, m=4 和 batch_size=2, p=4, q=5) a = torch.tensor([[[1, 2], [3, 4], [5, 6]], [[7, 8], [9, 10], [11, 12]]]) b = torch.tensor([[[1, 2, 3], [4, 5, 6]], [[7, 8, 9], [10, 11, 12]]]) print("张量 a 形状:", a.shape) # 输出: torch.Size([2, 3, 2]) print("张量 b 形状:", b.shape) # 输出: torch.Size([2, 2, 3]) # 执行矩阵乘法 result = torch.matmul(a, b) print("结果形状:", result.shape) # 输出: torch.Size([2, 3, 3]) print("结果:") print(result) ``` 在这个例子中,张量 `a` 的形状为 `[2, 3, 2]`,表示有两组大小为 `(3, 2)` 的矩阵;张量 `b` 的形状为 `[2, 2, 3]`,表示有两组大小为 `(2, 3)` 的矩阵。`torch.matmul` 将每一对对应的矩阵相乘,并返回一个新的三维张量,其形状为 `[2, 3, 3]`[^1]。 #### 关键点解析 - **批量维度匹配**:如果输入张量具有相同的第一个维度,则该维度被视为批量维度。在此情况下,`torch.matmul` 会对每一组对应的数据分别进行矩阵乘法。 - **高维扩展**:当处理超过二维的张量时,`torch.matmul` 自动沿最后一个两个维度应用矩阵乘法规则[^2]。 - **与其他函数的区别**:相比 `torch.mm` 和 `torch.bmm`,`torch.matmul` 更具灵活性,因为它仅限于特定维度的张量操作[^3]。 #### 应用场景 在深度学习模型中,尤其是涉及批量数据处理的情况下,`torch.matmul` 常被用来实现高效的矩阵运算。例如,在神经网络的全连接层中,权重矩阵与输入特征之间的乘积可以通过此函数快速完成。 ---
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值