mpirun之后跟一堆参数
[new01][[50181,1],0][btl_tcp_endpoint.c:657:mca_btl_tcp_endpoint_complete_connect] connect() to 10.1.1.102 failed: No route to host (113)
10.1.1.102是我的new02服务器
看了文章搞得头都大了
https://www.open-mpi.org/faq/?category=tcp#tcp-selection
添加文件
.openmpi/mca-params.conf
加入
btl_tcp_if_include 10.0.0.0/8
无解啊
最后说解决方案怎么都想不到居然是把iptables给关了就行了
之前测试了
mpirun -c 24 -hostfile hosts hello_c是正常的呢
解决的命令如下,我用的是redhat enterprise Linux 所以是
service iptables stop
本文详细阐述了使用mpirun运行并行应用时遇到的TCP连接失败问题,通过调整.openmpi/mca-params.conf配置文件加入btl_tcp_if_include参数,并最终发现关闭iptables服务能够解决问题的过程。
3924

被折叠的 条评论
为什么被折叠?



