单指令多数据(SIMD)技术详解
1. SIMD 简介
单指令多数据(SIMD)模式是最简单的并行处理方法,如今也最为常见。多数情况下,SIMD 模式等同于向量化。十年前,向量计算机价格昂贵,但编程相对简单。如今,受多媒体应用的推动,向量硬件在英特尔奔腾 III 和奔腾 4 个人电脑,以及苹果/摩托罗拉 G - 4 机器中已普遍存在。
内联函数(intrinsics)看似能让程序员贴近硬件,但实际上硬件控制是间接的,寄存器分配由编译器完成,可能并非程序员期望的结果。SSE2 或 Altivec 编程体现了一种指令级并行性,即 SIMD 或向量化,它能用单条指令处理多个数据。内联函数是包含一个或多个 SIMD 指令的 C 宏,用于对多个数据执行特定操作,通常每次处理 4 个字的数据。在英特尔 SSE 中,数据显式声明为 __mml28 数据类型;在 G - 4 Altivec 中使用向量变量。
2. 重要概念
以下四个基本概念至关重要:
- 内存访问
- 数据依赖 :涉及数据在计算过程中的相互依赖关系。
- 流水线和循环展开 :提高计算效率的重要手段。
- 分支执行
- 归约操作
为了更好地理解这些概念,将通过以下示例进行说明:
- 线性代数 :一级基本线性代数子程序(BLAS),包括向量更新(-axpy)、归约操作和线性搜索。
-
超级会员免费看
订阅专栏 解锁全文
105

被折叠的 条评论
为什么被折叠?



