14、ARM 处理器中的乘法、累加与浮点运算

git9versioner

于 2025-11-28 12:47:21 发布

点赞数

CC 4.0 BY-SA版权

分类专栏：树莓派汇编：从零开始文章标签： ARM处理器乘法累加浮点运算

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/git9versioner/article/details/155622164

树莓派汇编：从零开始专栏收录该内容

22 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

ARM 处理器中的乘法、累加与浮点运算

1. 乘法与累加在重要应用中的作用

在 3D 图形领域，若将点表示为 4D 向量 [x, y, z, 1]，那么缩放、旋转、剪切和反射等仿射变换都可以用 4x4 矩阵来表示。多个这样的变换可以组合成一个单一矩阵。要将对象转换到场景中，就需要对对象的每个顶点进行矩阵乘法运算。运算速度越快，视频游戏中渲染一帧的速度也就越快。

在神经网络里，每一层神经元的计算都是先进行矩阵乘法，再应用非线性函数，其中矩阵乘法占据了大部分工作量。大多数神经网络有很多层神经元，每层都需要进行矩阵乘法。矩阵的大小与变量数量和神经元数量相关，因此矩阵维度通常达到数千。对象识别或语音翻译的速度取决于矩阵乘法的速度，也就是乘加运算的速度。

由于这些重要应用，ARM 处理器在硅片上为乘加运算分配了大量资源。

2. 累加指令

ARM 32 位指令集中有大量的乘加指令，常见的如下：
- MLA{S} Rd, Rn, Rm, Ra
- SMLAL{S} RdLo, RdHi, Rn, Rm
- SMLA Rd, Rn, Rm, Ra
- SMLAD{X} Rd, Rn, Rm, Ra
- SMLALD{X} RdLo, RdHi, Rn, Rm
- SMLAL RdLo, RdHi, Rn, Rm
- SMLAW Rd, Rn, Rm, Ra
- SMLSD{X} Rd, Rn, Rm, Ra
- SMLSD{X} RdLo, RdHi, Rn, Rm
- SMMLA{R} Rd, Rn, Rm, Ra
- SMMLS{R} Rd

会员秒杀 ¥9.9 重磅福利

超级会员免费看

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符 | 博主筛选后可见

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。