
parallel
文章平均质量分 78
wjcaiyf
这个作者很懒,什么都没留下…
展开
-
Torque(2.4.6)+maui(3.3.1)下对用户配置节点的办法
原创作者:zhangguangping转载自:点击打开链接最近配置集群的时候,遇到了一个问题:我们的集群组分比较复杂,想对不同的用户对不同的节点有不同的使用权。所以需要将节点对用户分配。这个问题困扰了几天。几天来,看手册,上网搜资料,将所有能找到的办法都试了,还是不理想。并且发现Torque和maui的讨论区以及小木虫论坛上都有人问过这个问题。下面我把我的解决办法分享给大家,希转载 2014-11-26 14:02:39 · 2235 阅读 · 0 评论 -
Run the MPI PingPong benchmark
We will use the MPI PingPong benchmark for our testing. By default, openmpi should use inifiniband networks in preference to any tcp networks it finds. However, we will force mpi to ignore tcp network转载 2017-04-03 12:25:09 · 1547 阅读 · 0 评论 -
OpenMPI, LSF, InfiniBand, Mellanox OFED and Intel MPI Benchmark: what is going on ?
I usually use the Intel MPI Benchmark (IMB) as a quick test to check everything is ok from a network point of view (connectivity and performance) My test cluster for today: OpenMPI转载 2017-04-02 22:28:34 · 3893 阅读 · 0 评论 -
maui 限制使用节点数
转载自:点击打开链接想限制每个用户使用的节点数,但这一问题的解决颇费了一番周折:1. 最初想到直接从 pbs_server 层面上改,直接修改 qmgr -c 'set queue qxx max_user_run=5' 可以设置队列 qxx 中每个用户最多同时运行 5 个任务。这个修改不用重启 pbs_server 服务直接生效。但问题是,这个只是限制任务数而非节点数,如果一转载 2016-04-29 16:28:20 · 4819 阅读 · 0 评论 -
torque 安装排错
一:在管理节点发现某个节点状态为down,这种情况有两种原因第一种原因:pbs_mom 配置文件错误1.分析:服务pbs_mom启动后,默认首先去查看/var/spool/torque/mom_priv目录下是否有config文件,如果有则根据该文件下指出的pbsserver的主机名去联系管理节点(以该文件为准),如果没有该文件,则根据/var/spool/torque/serve原创 2015-12-03 09:12:29 · 2686 阅读 · 0 评论 -
openmpi跨节点报错tcp_peer_send_blocking: send() to socket 9 failed: Broken pipe (32)
客户反应作业无法跨节点,运行测试命令如下mpirun -np 8 -hostfile hostfilt.txt sleep 5运行后报错如下:[test02:01719] [[24772,0],1] tcp_peer_send_blocking: send() to socket 9 failed: Broken pipe (32)--------------------------原创 2017-07-21 16:24:23 · 2853 阅读 · 0 评论