高性能计算概述
高性能计算机体系结构
- 并行向量处理机(PVP)
-
在均匀存储器访问(UMA)系统中,一个共享存储器可以为所有处理器通过一个互联网络进行访问,就如同一个单处理器访问它的存储器一样。所有处理器对任何存储单元有相同的访问时间。用于UMA中的互联网络可以是单总线、多总线或者是交叉开关。因为对共享存储器的访问是平衡的,故这类系统称为SMP(对称多处理器)系统。每个处理器有相等的机会读/写存储器,也有相同的访问速度。
-
大规模并行处理机(MPP)
-
分布共享存储多处理机(DSM)
-
分布式共享存储处理机属于计算机科学的一种机制,可以透过硬件或软件来实作。分散式共享内存主要使用在丛集电脑中,丛集电脑中的每一个网络结点(node)都有非共享的内存空间与共享的内存空间。
该共享内存的位置空间(address space)在所有结点是一致的。简单说,同一时间下在结点A读取0x00001234会和结点B读取0x00001234得到一样的值。
-
-
集群(Cluster)
-
集群(cluster)技术是一种较新的技术,通过集群技术,可以在付出较低成本的情况下获得在性能、可靠性、灵活性方面的相对较高的收益,其任务调度则是集群系统中的核心技术。
集群是一组相互独立的、通过高速网络互联的计算机,它们构成了一个组,并以单一系统的模式加以管理。一个客户与集群相互作用时,集群像是一个独立的服务器。集群配置是用于提高可用性和可缩放性。
并行体系结构发展史
20年来,提高计算性能的“三驾马车”:提高主频、优化体系结构、提高并行度
主频受功耗的限制难以提升
指令集并行的潜力已经挖尽,现在基于CISC的x86架构由于结构复杂发展受阻,更多研究聚焦于RISC技术。
并行计算面临的重大问题
- 存储墙问题
CPU的执行速度远高于访存速度,如果计算中出现大量的内存访问就会降低速度
-
能耗问题
大型的高性能计算机如果要实现E级系统,需要专门的电站进行供电,并且高能耗还意味着需要制冷系统。
-
可靠性问题
系统规模增大导致系统固有的可靠性降低,千万亿次系统的平均无故障时间只有8小时左右,并且计算性能提升,故障发生时间显然提前。
-
大规模并行程序设计问题
1.现在的intel和一些其他公司已经开始对CPU进行异构设计,比如大小核设计,这样的技术势必会增加并行程序开发的复杂度。2.负载不平衡造成的扩展瓶颈。3.容错占用了大量的时间。