19、X86 - SSE编程：标量浮点运算详解

最新推荐文章于 2025-11-19 15:25:50 发布

浮生若梦622

最新推荐文章于 2025-11-19 15:25:50 发布

阅读量7

点赞数

CC 4.0 BY-SA版权

分类专栏：现代X86汇编精要文章标签： x86 SSE 标量浮点运算

本文链接：https://blog.youkuaiyun.com/opencv7vision/article/details/155609857

现代X86汇编精要专栏收录该内容

46 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

X86 - SSE编程：标量浮点运算详解

1. 标量浮点算术运算

x86 - SSE的标量单精度浮点算术指令仅修改目标XMM寄存器的低32位，高位不变。使用 movss 指令将每个算术指令的结果保存到调用者提供的数组中，虽然 movss 操作数在内存中的对齐不是必需的，但为了性能考虑，建议进行对齐。

标量双精度浮点算术指令在函数 SseSfpArithmeticDouble_ 中展示，其逻辑结构与单精度版本类似。使用XMM寄存器中的标量双精度浮点值时，仅使用低64位，高位不变，同样建议对内存中的操作数进行对齐。

以下是 SseScalarFloatingPointArithmetic 示例程序的结果：
| 操作 | 单精度结果 | 双精度结果 |
| ---- | ---- | ---- |
| a | 2.500000 | 3.14159265358979 |
| b | -7.625000 | 2.71828182845905 |
| add | -5.125000 | 5.85987448204884 |
| sub | 10.125000 | 0.42331082513075 |
| mul | -19.062500 | 8.53973422267357 |
| div | -0.327869 | 1.15572734979092 |
| min | -7.625000 | 2.71828182845905 |
| max | 2.500000 | 3.1