基于docker搭建跨主机的spark集群并配置notebook(一)

本文档详细介绍了如何在宿主机上安装Docker,并通过一系列步骤,包括拉取镜像、安装SSH、JDK、Zookeeper、Hadoop、Spark和Anaconda2,最终创建一个能用于跨主机的Spark集群,并配置Notebook。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

一、制作docker镜像

知识水平尚有欠缺,对于dockerfile那一套理论也不熟悉,所以采取的制作一个docker镜像作为启动集群的载体:
该集群有12个节点,即12个容器,平均分配在两个宿主机上,具体名字是master、node1、node2、......、node11

(一)在宿主机安装docker:

不同的系统安装docker的方法

(二)拉取一个docker镜像

我选择的ubuntu 16.04
#docker pull ubuntu:16.04

(三)启动一个容器

#docker run -v /home/docker/software/:/software -it ubuntu:16.04
-v参数将宿主机的/home/docker/software目录映射到了容器的software目录下

(四)将需要安装的软件拷贝到宿主机/home/docker/software目录下

1、jdk(1.8)
2、Zookeeper(3.4.5)
3、Hadoop(2.7.3)
4、Spark(2.1.0)
5、scala(2.10.5)
6、Anaconda2(4.3.0)
在容器的/software目录下就可以看到这些安装包了

(五)在容器中安装ssh

#apt-get install ssh
如果下载速度很慢,建议换下源
将ssh服务配置为开机启动
#vim ~/.bashrc
加入/usr/sbin/sshd
#vim /etc/rc.local
加入/usr/sbin/sshd
生成访问密钥
#cd ~/
#ssh-keygen -t rsa -P '' -f ~/.ssh/id_rsa
#cd .ssh
#cat id_rsa.pub >> authorized_keys

(六)安装jdk

解压/software目录下的jdk安装包,将解压后的jdk文件夹移动到新建的/usr/java目录下,重命名为jdk
配置环境变量
#vim ~/.bashrc
在末尾添加
export JAVA_HOME=/usr/java/jdk
export PATH=$PATH:$JAVA_HOME/bin
检查是否安装成功
#java -version

(七)安装Zookeeper

将zookeeper安装包解压到/root目录下并重命名为zookeeper
#mv /software/zookeeper-3.4.5.tar.gz ~ 
#tar -zxvf software/zookeeper-3.4.5.tar.gz 
#mv ~/zookeeper-3.4.5 zookeeper
配置zookeeper
#cd ~/zookeeper/conf/
#cp zoo_sample.cfg zoo.cfg
#vim zoo.cfg
修改dataDir = /root/zookeeper/tmp
在最后添加
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值