hadoop伪分布式+spark环境+scala环境

最新推荐文章于 2024-05-01 16:13:12 发布

原创

最新推荐文章于 2024-05-01 16:13:12 发布 · 1.7k 阅读

·

27

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#分布式 #hadoop #spark

目录

1.修改主机名

java环境配置

1.查看Linux是否安装了java jdk，如果查询有其他的java版本，则需要删除

2.解压，压缩包与重命名

3.修改java环境变量

4.配置文件生效 source /etc/profile---也可以写成 . /etc/profile

hadoop的环境配置

2.修改配置文件vi /etc/profile

3.配置文件生效，查看hadoop的版本

hadoop集群伪分布式

一、查看是否安装了ssh

2.启动ssh服务

3.本机生成公钥，私钥和验证文件

4.将登录的信息复制到验证文件

二、HDFS的配置文件

1.配置hadoop-env.sh

2.配置vi core-site.xml

3.配置vi hdfs-site.xml

4.格式化HDFS

三、YARN的配置

1.进入hadoop配置目录：

2.配置mapred-site.xml.template

四、启动服务用户定义

1.用户定义 vi /etc/profile

2.启动hdfs或yarn服务

spark的环境搭建

spark的配置文件位置

1.拷贝文件在解压的目录下的../conf/

/conf/spark-env.sh

2.主配置文件也要写/etc/profile

3. source /etc/profile使环境生效

4.启动集群：spark下sbin目录下：./start-all.sh编辑

5.可用jps看是否有这三个进程

6.查看spark是否安装成功返回主目录下输入spark-submit --version

1.scala的配置文件，直接写在/etc/profile下

2.source /etc/profile使环境变量生效，接着scala -version查看是否安装成功，出现画线版本号即为成功(或者直接输入scala)编辑

以下是要准备的包：

1.java的包--jdk

2.hadoop的包

spark和scala是基于Hadoop环境部署安装的

3.scala包：

https://www.scala-lang.org/download/all.html

注意：这里spark与scala的包最好都统一版本，还有下以.tgz结尾的包

4.spark包：

Index of /spark/spark-3.5.1 (apache.org)

上传到linux上(记住位置)

首先解压spark

之后在解压scala，与spark的解压同理

hadoop与java也是一样的解压方式

我的文件位置，以下的操作皆为我的文件位置来写

把以上的压缩包都准备好，接下来开始搭建hadoop+spark+scala伪分布式集群

基础环境

注意：在搭建Hadoop的时候需要关闭防火墙与安全上下文(这里默认以及配好ip)

1.修改主机名

hostnamectl set-hostname hadoop[修改的主机名]

bash //启动

2.网络映射

vi /etc/hosts

java环境配置

1.查看Linux是否安装了java jdk，如果查询有其他的java版本，则需要删除

删除命令：rpm -e --nodeps [java名]

2.解压，压缩包与重命名

重命名： mv [原文件] [新文件]

3.修改java环境变量

在最后三行写：vi /etc/profile

export JAVA_HOME=/opt/jdk
export PATH=$JAVA_HOME/bin:$PATH

4.配置文件生效 source /etc/profile---也可以写成 . /etc/profile

hadoop的环境配置

1.解压hadoop

2.修改配置文件vi /etc/profile

在最后三行写！！以下所有的配置文件都是在最后写

#hadoop
export HADOOP_HOME=/opt/hadoop
export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

3.配置文件生效，查看hadoop的版本

hadoop集群伪分布式

一、查看是否安装了ssh

主要的圈了起来：

如果没有的话需要安装：
yum install -y openssh-clients openssh-server

2.启动ssh服务

systemctl restart sshd

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。