高性能计算平台基础使用指南
前言
- 第一次接触使用学校的高性能平台是在今年上半年进行毕业设计的时候,当时有大量的数据需要在Matab中进行模型运算,便向学校申请了账号,使用了HPC平台。计算速度确实比个人电脑快了太多太多。
- 近期,有很多初次想使用高性能计算平台的研究生学长学姐来向我咨询,一遍遍说明确实很麻烦,决定趁着周末的空挡来写下这篇入门使用指南(已经熟悉使用linux系统的可不用观看,直接阅读LFS系统操作手册即可)。
什么高性能计算
- 高性能计算简称 HPC,是指利用聚集起来的计算能力来处理标准工作站无法完成的数据密集型计算任务,包括仿真、建模和渲染等。我们在处理各种计算问题时常常遇到这样的情况:由于需要大量的运算,一台通用的计算机无法在合理的时间内完成工作,或者由于所需的数据量过大而可用的资源有限,导致根本无法执行计算。HPC 方法通过使用专门或高端的硬件,或是将多个单元的计算能力进行整合,能够有效地克服这些限制。将数据和运算相应地分布到多个单元中。
- 说的简单点,就是把你需要计算的东西交给一群特别厉害的电脑帮你同时算,提高整体的运算效率。
南京工业大学高性能计算平台
- 本校高性能计算平台由2个登录节点、1个管理节点、2个IO节点、96个计算节点、存储系统以及网络系统构成,具体节点配置情况在这里不作过多叙述。
整个集群计算节点浮点运算理论峰值约为:75.26 Tflops,实测值约为69.12Tflops,达到理论峰值90%以上;存储可用容量达到264TB。实测读写带宽大于5892MB/S 。
- 平台操作系统:CentOS Linux release 7.3.1611 (Core)
- 平台作业管理系统:Platform LSF 10.1
这里解释一下,高性能计算平台上进行运算是需要将自己的运算过程编写成脚本,然后提交到作业管理系统中,由该系统根据当前账户的优先级、计算节点的空闲情况以及脚本提交的先后顺序来判定进行哪一项脚本的运算。在高性能计算平台中,严禁直接在登录节点上运行脚本进行计算。
- 编译软件:
Intel® Parallel Studio XE 2015 Update 3 Cluster Edition
Intel® Parallel Studio XE 2017 Update 6 Cluster Edition
Intel™ Parallel Studio XE 2019 Cluster Edition - 常用软件:通过
ls /gpfs/soft
命令查看已安装的软件。
学校高性能计算中心并未购买任何商业软件的使用授权,用户需自行解决软件版权问题,用户由于软件使用而产生的所有版权问题与高性能计算中心无关!
- 队列分布:
Test:运行测试任务,运行于 node02,运行时间 20min。
Normal:运行普通并行作业,运行于node1~node70节点 ,除 node02提交任务时在作业脚本中需加-q normal
,运行时间为 5天 。
High:优先级高,只有高成果数的用户,申请后经中心专家委员会审核,才可以提交。
compute2:运行大并行作业(slots大于等于32),运行于node71~node94节点 。
Fat:运行大内存作业( MEM需求大于等于100GB)。
GPU:运行需要使用GPU的作业(需特别申请才可使用)。 - 存储系统:
存储系统为 Lenovo DS5760,裸容量为 384TB。
对应目录:/gpfs
可用容量:262TB
高斯等一些高读写的软件需要高速缓存盘,目前设置是在本地
/tmp
目录下,但是这个固态硬盘只有200GB容量,为了满足大缓存需求现在高性能计算平台提供4TB高速缓存盘/scratch
。注意:本地固态硬盘速度比此高缓存读写快,因小作业请不要修改到/scratch
。
如何登录
-
下载Xshell远程连接客户端。到Xshell官网使用本校Njtech邮箱下载学校用户免费版,点此直达,输入邮箱、姓名,下载链接便会发送至学校Njtech邮箱中,下载安装即可,安装过程全部选择默认。
-
Xshell安装完成后,双击桌面Xshell图标,打开软件。点击会话框中的新建。
-
在弹出的会话框中输入正确的主机与端口号。
南京工业大学高性能平台登录节点主机为:
10.3.249.8
或10.3.249.9
,二者选用一个登录即可,端口号均为22,平台只能在Njtech、Njtech-Home系列WIFI下,和有线接入学校网络的情况下登录。
4. 在左侧类别中,选择**用户身份验证**,然后在对话框中输入自己的 用户名与密码,点击连接即可。
高性能计算平台的用户名和密码为 智慧南工平台的学号(工号)与密码。
5. 当前电脑首次连接时会出现下列警告,选择接受并保存。
6. 出现下列界面,便已经登录成功。
如何进行文件传输
- 下载安装WinSCP,打开官网下载最新版,点此直达。
WinSCP是一个 Windows 环境下使用的 SSH 的开源图形化 SFTP 客户端。同时支持 SCP 协议。它的主要功能是在本地与远程计算机间安全地复制文件,并且可以直接编辑文件。
2. 安装过程,全部选择默认选项安装。
3. 双击桌面WinScp图标,打开软件,在新建连接页面中选择文件协议为:SCP
4. 输入主机、端口号、用户名、密码,这些同Xshell中的信息。可以在登录前选择保存并记住密码,方便下次登录。信息填写完毕后,点击登录。
5. 首次登录会提示下列警告,选择是即可。
6. 出现当前用户的主目录时,便登录成功。