6.神操作（把master上的三个安装包scp给slave）—Hadoop完全分布式搭建完成

最新推荐文章于 2023-06-09 12:01:28 发布

原创

最新推荐文章于 2023-06-09 12:01:28 发布 · 2.5k 阅读

1 ·

CC 4.0 BY-SA版权

该博客详细介绍了如何将master节点上的Hadoop安装包、环境变量文件通过SCP命令复制到slave1和slave2的/data目录，并在slave节点上激活环境变量，以及复制hadoop日志目录，完成Hadoop完全分布式搭建过程。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

【一个很疑惑的问题】
    为什么我们一直在反复做一个操作：就是scp拷贝过来拷贝过去？
【答案】这是为了将文件或目录的权限修改成hadoop所属组。

一、把master上的3个安装包拷贝到slave1、slave2机器上的/data目录下

先进入/data目录下，打开终端，不用修改用户

再：
scp -r hadoop-2.6.5/  scala-2.11.8/  jdk1.8.0_111/ hadoop@slave1:/data/

scp -r hadoop-2.6.5/  scala-2.11.8/  jdk1.8.0_111/ hadoop@slave2:/data/

二、把master上的环境变量文件~/.bashrc拷贝到slave1、slave2机器上的/data目录下

最低0.47元/天解锁文章

200万优质内容无限畅学

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

GoJawee

关注关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

hadoop完全分布式搭建

ordo120的专栏

08-01

949

执行命令的前提是：必须要在jdk-8u162-linux-x64.tar.gz压缩包的目录下/opt/package。如果提示no such directory ，表示/root/.ssh路径不存在，所以需要先创建文件夹。1、ssh-copy-id： ssh master 需要密码登录，每台电脑都做三次。绝对是slave2的ip地址出现问题。我自己的路径跟教程的路径不一致怎么办？2、上传压缩包后，找不到我上传的文件在哪里。解压完后，需要在/opt/找解压后的文件。-C解压到指定的路径：/opt/

Hadoop完全分布式及相应组件的搭建

m0_74749094的博客

04-22

1906

分别命名为master、slave1、slave2，然后使用bash命令刷新一下，最后使用hostname命令查看是否修改成功。

参与评论您还未登录，请先登录后发表或查看评论

Linux基础环境搭建（CentOS7）- 安装JDK

热门推荐

09-17

4万+

Linux基础环境搭建（CentOS7）- 安装JDK 1 JDK的下载及安装 java是当前比较流行的一种编程语言，当我们开始学习java的时候肯定会先要安装jdk，然后进行环境变量控制。 JRE(Java Runtime Environment ) Java运行环境，用来运行JAVA程序的。 JDK(Java Development Kit) Java开发工具包，包含JRE。因此只需要下载安装JDK即可中。 JDK是Sun Microsystems针对Java开发员的产品，JSP运行环境需要JDK的支

hadoop 多机全分布式安装步骤（虚拟机1master+2slave）

Michael是个半路程序员

03-11

3881

文章目录1. 虚拟机安装Centos7 1. 虚拟机安装Centos7 安装3台虚拟机，centos7，一个master，两个slave

hadoop 命令scp

Lian_Easel的博客

04-20

3650

1.在安装HBASE的过程中，需要把master的文件复制到slave1、slave2中。 scp -r hbase slave1 : ~/ 这条语句中，scp -r 后面接的是需要复制的文件的地址，冒号后面的是复制到slave1中后的目录地址。在使用这条命令的过程中，刚开始出现的问题是：找不到目标文件，目录地址找不到，所以解决方法是可以进入到相应的目录文件比如 cd hbase。...

大数据处理学习笔记2.2

m0_74001992的博客

06-09

156

一、Spark开发环境准备工作由于Spark仅仅是一种计算框架，不负责数据的存储和管理，因此，通常都会将Spark和Hadoop进行统一部署，由Hadoop中的HDFS、HBase等组件负责数据的存储管理，Spark负责数据计算。安装Spark集群前，需要安装Hadoop环境二、了解Spark的部署模式（一）Standalone模式Standalone模式被称为集群单机模式。

linux常规操作，向其他服务器传递文件等

qq_44079295的博客

08-30

708

1、scp远程传输命令，slave1必须是在hostname文件中配置好的地址映射，是另一台主机的访问ip映射，将本地的hosts传输到slave1主机的etc文件夹下，如果没有设置好地址映射的话，就将slave1换为你要接受文件的主机的ip地址 scp /etc/hosts slave1:/etc 传输文件夹的话加上-r scp -r xxx yyy 2、mkdir mkdir -p /data/packs mkdir /software 3、解压缩 tar zxvf hadoop-3.2.2.ta

Hadoop完全分布式部署

weixin_52626164的博客

08-06

3485

host映射：这里是把三个Linux的ip地址保存到三个虚拟机去，相当于我们自己在手机里面存别人的电话号码一样的道理，这样相互之间就知道对应ip地址的机器是哪一台。所以这个操作也是要在三台虚拟机都要进行的。给ip地址起名字，几个机器需要互相连通，这样在连接几台机器的时候只需要使用机器名就行，不需要使用ip地址。...

高性能Mysql主从架构的复制原理及配置详解

无界编程

03-28

3073

1 复制概述 Mysql内建的复制功能是构建大型，高性能应用程序的基础。将Mysql的数据分布到多个系统上去，这种分布的机制，是通过将Mysql的某一台主机的数据复制到其它主机（slaves）上，并重新执行一遍来实现的。复制过程中一个服务器充当主服务器，而一个或多个其它服务器充当从服务器。主服务器将更新写入二进制日志文件，并维护文件的一个索引以跟踪日志循环。这些日志可以记录发送到从服务器

大数据技能大赛题目(高职组，模块A和B)

weixin_54412689的博客

04-27

5386

大数据技能大赛（高职组）

copy-to-slave.hpi

07-21

网上找了很久没有找到copy-to-slave.hpi，所以去github下载了插件源码，编译出来用。给需要的朋友。执行构建前，可以拷贝文件到workspace

2021年全国职业院校技能大赛 “大数据技术与应用”—模拟赛题（一）

white_mvlog的博客

10-24

2万+

2021年全国职业院校技能大赛 “大数据技术与应用” ——模拟赛题（一）持续更新相关赛题，包括2021年国赛模拟题10套、2019年广东省真题赛题、相关比赛技巧、难点突破技巧等等，需要的关注小编或者公众号 NoWrite

【2019全国职业技能大赛大数据技术】任务一：Hadoop 相关组件安装部署（15分_答案上＜图片+分值＞）

Yummy的博客

03-30

4225

叮咚，我回来啦~！！ “博主，你再不更新答案，我们要取关了哈！！” ahhhh我好怕【擦汗ing】，在此向等待更新的小伙伴表示歉意啦【真挚ing】，看过我上一篇文章的朋友都在期待答案【2019全国职业技能大赛大数据技术】任务一：1-Hadoop 相关组件安装部署（上），但因为个人行程安排+忙+懒？，所以到现在才更新，不好意思，让大家久等了，Thanks♪(･ω･)ﾉ感谢一路来的支持，小女子任继续加油，好啦，废话不多说我们来对对答案吧！！冲！任务一：Hadoop 相关组件安装部署（15 分）一

Redis系列之六------Redis的复制(Master/Slave)

zpeien

05-23

586

目录 Redis系列之六------Redis的复制(Master/Slave) 一、Redis 的复制是什么？二、Redis 复制的案例 1、配置准备环境 1）拷贝多个redis.conf文件 2、一主二仆 3、薪火相传 4、反客为主三、复制原理四、哨兵模式(sentinel) 1、演示 1）建立sentinel.conf 2)配置哨兵,填写内容 3）启动哨兵 4）主机挂了五、复制的缺点 Redis系列 Redis系列之六------Redis的复制(M..

2021年全国职业院校技能大赛 “大数据技术与应用”—模拟赛题（二）

white_mvlog的博客

11-19

4595

2021年全国职业院校技能大赛 “大数据技术与应用” ——模拟赛题（二）持续更新相关赛题，包括2021年国赛模拟题10套、2019年广东省真题赛题、相关比赛技巧、难点突破技巧等等，需要的关注小编或者公众号 NoWrite

Hadoop集群安装环境搭建-纯命令行

weixin_43247092的博客

04-28

442

Hadoop集群安装环境搭建-纯命令行Hadoop集群安装配置流程Master节点安装SSH serverMaster节点安装JAVA环境Master节点安装Hadoop并完成配置Slave节点安装SSH server，JAVA环境修改Master和Slave的主机名及IP主机名对应文件。Master节点无密码SSH登陆到Slave节点配置集群/分布式环境Master节点上的/usr/local/...

mysql replication copy master to slave

screaming的博客

05-23

579

MySQL 复制介绍及搭建 2016/04/29 · IT技术 · MySQL, 数据库分享到：1 原文出处： bestvivi MySQL复制介绍 MySQL复制就是一台MySQL服务器（slave）从另一台MySQL服务器（master）进行日志的复制然后再解析日志并应用到自身，类似Oracle中的Data Guard。 MySQ

scp 传目录_scp拷贝文件及文件夹

weixin_42469315的博客

01-13

1万+

拷贝文件夹把当前文件夹tempA拷贝到目标服务器10.127.40.25 服务器的 /tmp/wang/文件夹下scp-r /tmp/tempA/wasadmin@10.127.40.25:/tmp/wang/其中wasadmin是目标服务器的用户名，执行命令提示输入密码，然后输入密码即可拷贝文件把当前文件tempA.txt拷贝到目标服务器10.127.40.25 服务器的 /tmp/wa...

Jenkins插件之Workspace cleanup + Copy to slave

weixin_34405354的博客

11-21

624

Workspace Cleanup Plugin Copy To Slave Plugin 一 workspace cleanup 插件用来在build开始前或build完成后清理workspace。还可以Post-build actions中设置delete workspace wh...

Hadoop 完全分布式集群 wang

最新发布

03-30

### Hadoop 完全分布式集群配置教程 #### 1. 虚拟机安装与基础设置在构建 Hadoop 完全分布式集群之前，需完成虚拟机的基础环境准备。这包括操作系统安装、网络配置以及主机名设定等操作[^1]。 #### 2. 前置环境设置为了实现无密码 SSH 登录，在主节点上生成公钥并将其复制至所有从节点。具体命令如下： ```bash ssh-keygen -t rsa ssh-copy-id hd@hadoopSlave01 ssh-copy-id hd@hadoopSlave02 ``` 此外，还需确认各节点间能够通过主机名相互访问，并验证免密登录功能是否正常工作[^3]。 #### 3. JDK 及 Hadoop 的安装与配置 ##### (a) 解压软件包将下载好的 Hadoop 和 JDK 安装包上传至服务器后进行解压缩处理。 ```bash tar -zxvf jdk-8uXXX-linux-x64.tar.gz -C /opt/module/ tar -zxvf hadoop-3.X.X.tar.gz -C /opt/module/ ``` ##### (b) 设置环境变量编辑 `/etc/profile` 文件以定义必要的路径参数，确保每台机器都具备一致的配置内容[^4]: ```bash export JAVA_HOME=/opt/module/jdk1.8.0_XXX export HADOOP_HOME=/opt/module/hadoop-3.X.X export PATH=$PATH:$JAVA_HOME/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbin ``` 执行 `source /etc/profile` 更新当前会话中的更改效果。 ##### (c) 修改核心配置文件进入 `$HADOOP_HOME/etc/hadoop/` 目录调整以下几项主要文档： ###### i. **core-site.xml** 指定默认文件系统地址及其存储位置。 ```xml <configuration> <property> <name>fs.defaultFS</name> <value>hdfs://hadoopMaster:9000</value> </property> <property> <name>hadoop.tmp.dir</name> <value>/opt/data/tmp</value> </property> </configuration> ``` ###### ii. **hdfs-site.xml** 增加副本数量和命名节点元数据保存地点的信息。 ```xml <configuration> <property> <name>dfs.replication</name> <value>2</value> </property> <property> <name>dfs.namenode.name.dir</name> <value>file:/opt/data/namenode</value> </property> <property> <name>dfs.datanode.data.dir</name> <value>file:/opt/data/datanode</value> </property> </configuration> ``` ###### iii. **mapred-site.xml** 启用 YARN 上运行 MapReduce 应用程序的功能。 ```xml <configuration> <property> <name>mapreduce.framework.name</name> <value>yarn</value> </property> </configuration> ``` ###### iv. **yarn-site.xml** 配置 ResourceManager 地址及其他资源管理选项。 ```xml <configuration> <property> <name>yarn.resourcemanager.hostname</name> <value>hadoopMaster</value> </property> <property> <name>yarn.nodemanager.aux-services</name> <value>mapreduce_shuffle</value> </property> </configuration> ``` ###### v. **workers 或 slaves 文件** 列出所有的 DataNode 主机名称以便自动识别成员身份。 ``` hadoopSlave01 hadoopSlave02 ``` #### 4. 启动前准备工作初次启动时需要初始化 NameNode 数据结构，此过程仅限于第一次部署阶段使用特定指令完成格式化动作[^2]: ```bash hdfs namenode -format ``` 随后利用脚本批量同步修改后的配置资料到其他子节点之上: ```bash scp -r $HADOOP_HOME hd@hadoopSlave01:/opt/module/ scp -r $HADOOP_HOME hd@hadoopSlave02:/opt/module/ ``` #### 5. 开启服务进程按照顺序依次激活各个组件实例来保障整体架构平稳运作: ```bash start-dfs.sh start-yarn.sh mr-jobhistory-daemon.sh start historyserver ``` 最后可通过浏览器界面查看状态概览页面(http://master_ip:9870, http://master_ip:8088)，从而判断整个框架是否成功上线运转起来。 ---