下载地址:
1. 高性能计算简介... 4
1.1. 高性能计算硬件结构... 4
1.2. 高性能计算机总体结构... 5
1.3. 高性能计算集群性能指标... 5
1.3.1. 衡量高性能计算集群的评价指标... 5
1.3.2. 测试程序... 6
2. 计算节点... 9
2.1. 同构计算节点... 9
2.2. 异构计算节点... 9
2.2.1. CPU+GPU异构计算... 9
2.2.2. CPU+MIC异构计算... 10
3. 存储系统... 10
3.1. 存储网络... 10
3.1.1. DAS (Direct Attached Storage)10
3.1.2. NAS (Network Attached Storage)11
3.1.3. SAN (Storage Area Network)11
3.1.4. 存储网络的三种形态比较... 12
3.2. RAID.. 12
3.2.1. RAID数据存取方式... 13
3.2.2. RAID0. 13
3.2.3. RAID1. 14
3.2.4. RAID5. 14
3.2.5. RAID6 P+Q.. 15
3.2.6. RAID 10. 16
3.2.7. 常见RAID级别的比较... 17
3.2.8. 热备技术(HotSpare)... 17
3.3. 分布式文件系统... 17
3.3.1. 文件系统... 17
3.3.2. 基于集群的分布式架构... 18
3.3.3. 性能评价方法... 19
3.4. 并行文件系统... 19
3.4.1. 常见的并行文件系统... 19
3.4.2. PVFS. 19
3.4.3. Lustre. 20
4. 网络系统... 24
4.1. 以太网... 24
4.2. InfiniBand网络... 24
4.2.1. InfiniBand基本组件... 25
4.2.2. InfiniBand应用... 25
4.2.3. IB工作模式... 25
4.2.4. Infiniband的特点... 26
4.2.5. IB通信协议... 26
5. 集群管理软件... 26
5.1. 集群管理系统... 26
5.1.1. 集群系统的特点... 26
5.1.2. 集群管理系统的主要功能... 27
5.2. 集群作业调度系统... 27
5.2.1. Torque 安装... 27
5.2.2. Torque PBS 使用... 28
5.2.3. PBS 脚本示例... 29
5.2.4. pbs 常用命令和选项... 30
6. 并行环境与并行开发... 31
6.1. 编译器... 31
6.1.1. GNU编译器... 31
6.1.2. Intel编译器... 31
6.1.3. PGI编译器... 32
6.1.4. 其它编译器... 32
6.1.5. 编译优化选项... 32
6.1.6. NVCC编译器... 32
6.2. 并行编程模型... 33
6.2.1. OpenMP. 33
6.2.2. Pthread. 33
6.2.3. CUDA. 33
6.2.4. OpenCL. 34
6.2.5. MIC平台编程模型... 34
6.2.6. MPI35
6.3. 数学库... 36
6.3.1. Blas库... 36
6.3.2. FFTW库... 36
6.3.3. CUDA库... 37
6.4. 并行开发... 38
6.4.1. GPU与MIC对比... 38
6.4.2. 异构计算多级并行... 39
6.4.3. 负载均衡... 39
6.4.4. 通信... 44
7. 容错... 46
7.1. MPI进程容错... 46
7.1.1. 系统级容错... 46
7.1.2. 应用级容错 46

本文深入探讨了高性能计算领域的核心概念,包括硬件结构、计算节点、存储系统、网络系统、集群管理软件、并行环境与开发、容错机制等。详细介绍了高性能计算集群的性能指标、计算节点的异构配置、存储系统的RAID技术和分布式文件系统、网络系统的以太网与InfiniBand网络,以及集群管理软件如Torque和并行开发技术如OpenMP、CUDA等。

被折叠的 条评论
为什么被折叠?



