
并行多核体系结构基础 Yan Solihin
文章平均质量分 93
多核体系结构深入剖析
高性能计算工程师
做一个极客!
展开
-
第11章 互连网络体系结构
之前,我们尚未讨论如何可靠、快速地将消息从一个节点发送到另一个节点。本章目的是讨论多个处理器互连的结构。互连网络最重要的两个性能指标是延迟和带宽。基于共享存储多处理器的几个通信特性,与诸如局域网或因特网等其他网络系统相比,共享存储多处理器对互连结构性能具有独特的要求:1. 消息非常短。许多消息是一致性协议的请求和响应,但不包含数据,也有一些消息包含少量(高速缓存块大小的)数据,这些数据在当前主流系统中为64或128字节。2. 消息生成很频繁,因为每个读或写缺失都可能生成涉及几个节点的一致性消息。原创 2024-02-25 01:00:00 · 726 阅读 · 0 评论 -
第10章 高级缓存一致性设计
缓存一致性协议如何适应更大规模的系统。广播和侦听协议更早地涉及了可扩展性问题,因为流量和侦听频率时随着处理器个数的增加至少呈线性增加趋势,可用的互连网络带宽会很快被广播流量占满。本章讨论的基于目录式缓存一致性协议来实现可扩展性。主要问题在于如何处理协议竞争,以及瞬时状态的使用等。以及,讨论当前多核设计问题,例如如何处理不精确的目录信息、讨论一致性需要被以单个粒度来跟踪还是以多个粒度来跟踪、如何设计一致性可允许多核系统系统执行分区,以及线程迁移代价如何降低。原创 2024-02-24 01:00:00 · 2465 阅读 · 0 评论 -
第8章 对同步的硬件支持
为了保证并行程序执行的正确性和高效性,构建一个共享存储多处理器系统的硬件支持必须要解决缓存一致性、存储一致性和对同步原语的支持等问题。从软件的观点来看被广泛使用的同步原语包括锁、栅栏和点对点同步(信号量)。举例来说,锁和路障被大量使用在DOALL并行性和具有链式数据结构的应用程序上,而signal/wait同步对流水线DOACROSS并行性来说至关重要。如今将最低级别的同步原语以原子指令的形式在硬件上实现,然后将其他所有高级别的同步原语在软件中实现。原创 2024-02-20 02:00:00 · 1722 阅读 · 0 评论 -
第7章 缓存一致性基础
多个处理器单元互连的存储层次不同,使用的互连网络类型也不相同。1. 在共享缓存的方式中,缓存被所有处理器共享,每个处理器可以直接访问缓存的任意一部分。优点在于不需要缓存一致性的支持,因为系统中只有一个缓存,任何需要被缓存的数据都会被存放在一个唯一的地址。缺点是处理器核缓存需要被部署在非常近的距离之内,否则访问缓存的时延会非常高。另外,互连网络必须提供很高的带宽,因为所有存储器访问都必须通过互连网络。原创 2024-02-04 01:00:00 · 1282 阅读 · 0 评论 -
第1章 多核体系结构概述 摘录
多核首次实现了芯片上的并行计算。在多核之前,集群(超算)系统才能执行并行计算。是什么促使人们使用并行计算机?1. 与单个处理器系统提供的性能相比,并行计算机能够提供的绝对性能。某些科学发现的速度取决于在计算机上解决特定计算问题的速度。2. 成本调控的性能或功耗调控的性能方面更具吸引力。多核系统的成本比集群系统相对较小,尤其是软件成本和系统维护方面。在回顾并行计算机的历史时,应该记住摩尔定律是如何改变处理器体系结构的。并行体系结构最初是一个自然而然的想法,原创 2023-07-08 15:34:26 · 554 阅读 · 0 评论 -
第9章 存储一致性模型 摘录
存储器一致性原创 2022-10-12 09:33:53 · 753 阅读 · 0 评论 -
第6章 共享存储多处理器简介 摘录
共享处理器简介原创 2022-10-08 09:01:30 · 623 阅读 · 0 评论 -
第5章 存储层次结构概述 摘录
缓存结构原创 2022-09-29 10:29:05 · 1316 阅读 · 0 评论 -
第4章 针对链式数据结构的并行 摘录
LDS并行原创 2022-08-23 11:04:32 · 405 阅读 · 0 评论 -
第3章 共享存储并行编程 摘录
并行多核原创 2022-08-11 09:43:49 · 923 阅读 · 0 评论