在上一篇文章里,我们已经基本建立好了.ssh协议集群,接下来我们安装MPICH2
1、解压缩
tar -zxvf mpich2-1.0.8.tar.gz
2、进入mpich2解压到的目录里
cd mpich2-1.0.8
3、创建安装目录
mkdir /home/jeneo/mpich
安装软件的三个基本步骤——检查配置、编译、安装,这次在./configure后设置了安装目录
sudo ./configure --prefix=/home/ad/mpich --disable-f77 –disable-fc
sudo make
sudo make install(这一步将make后生成的东西拷贝到--prefix=指定的目录下)
4、修改环境变量(编辑.bashrc文件)
sudo vim ~/.bashrc
修改环境变量为(在最后新增PATH一行):
export PATH=/home/jeneo/mpich/bin:$PATH
然后让设置生效 source ~/.bashrc
5、创建/home/jeneo/.mpd.conf文件
vim /home/ad/.mpd.conf
文件中添加如下一行:
MPD_SECRETWORD=mypasswd
mypsswd在各个机器上都要相同,mpi根据这个相同的mypasswd确定信任结点
设置文件读取权限,设置成只能自己读写
chmod 600 .mpd.conf
可以ls -l .mpd.conf看是否属于该用户
6、创建主机名称集合文件mpd.hosts
vim mpd.hosts 文件内容如下:
lat
master
这个文件需要放到mpi程序同一个目录下,否则开启mpd的时候用“-f 完整路径”指定
7、本地测试
启动: mpd &
观看启动机器: mpdtrace
退出: mpdallexit
8、启动集群
boot -n 2 -f mpd.hosts (如果出现401错误)
mpdboot_dw (handle_mpd_output 401): failed to connect to mpd on wx
解决办法:关闭防火墙
cd /sbin
sudo iptables -F
sudo iptables -L
参数-n 2指定了要起动的机器个数,-f mpd.hosts指定了通过mpd.hosts运行
mpdtrace -------显示mpd.hosts中的主机名
当显示:
lat
master
时表示配置成功
mpdallexit -------退出mpd