搭建Hadoop VM集群

最新推荐文章于 2024-07-30 08:38:53 发布

原创

最新推荐文章于 2024-07-30 08:38:53 发布 · 1.6k 阅读

1 ·

CC 4.0 BY-SA版权

文章标签：

#Hadoop

本文记录了在VM上搭建Hadoop分布式环境的过程，包括VM的创建、SSH无密码登录配置、Hadoop节点设置，以及遇到的问题和解决方法。在实际操作中，遇到datanode和tasktracker启动后立即停止的问题，通过对日志分析解决了异常。

之前一直在单节点psudo-distributed模式下跑，觉得有必要试试搭建一个真正的distributed环境。期间参考了不少文章，这里做个小笔记。

VM创建

这里利用VMware创建一台VM做master，再链接克隆出一台VM做slave。碰到主要的问题有：1. 如何设置VM网络连接 2. 链接克隆slave VM后，如何修复网络配置。这已经在另外一篇文章中做了笔记。

master	192.168.15.131
slave	192.168.15.132

配置ssh无密码登录

每次启动master(运行bin/start-all.sh)时，创建每个deamon进程都提示输入密码，挺烦人的，最好配置ssh以无密码登录：

a. 对于namenode和jobtracker，需要配置master本身的ssh

yum install openssh-server.x86_64
ssh-keygen
cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys

b. 对于datanode和tasktracker，需要配置slave的ssh

scp root@192.168.15.131:~/.ssh/autorized_keys .
cat ./autorized_keys >> ~/.ssh/authorized_ke

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

天外有菌

关注关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

快速搭建虚拟机集群

晴晴晴的博客

03-20

5472

寒假结束后，我们开始了架构设计之旅。初次接触虚拟机，感觉就像是梦一样。在梦里，我们可以随意地想做什么就做什么，看谁不爽可以揍他一顿，看谁顺眼可以向他表白。一切一切都不会影响到现实，睁开眼睛生活还是在继续，该怎样还是会怎样。虚拟机也是这么一个存在，经常用它来试装系统啊软件啊什么的，测试病毒啊，没有后顾之忧，基本就是一个神奇的实验室关于虚拟机的一些笔记虚拟机（Virtual Machine

vm实现基本集群搭建准备

qq_44779906的博客

10-17

135

2、虚拟设备都能ping通外网，且在windows cmd窗口能ping通虚拟机。1、3台ip不同，物理地址不同，hostname不同的centos7的虚拟机，1、检查【ip,hostname不能相同】

参与评论您还未登录，请先登录后发表或查看评论

VMware虚拟机上搭建配置集群环境

07-06

集群是在一组计算机上运行相同的软件并虚拟成一台主机系统为客户端与应用提供服务；计算机通过缆线物理连接并通过集群软件实现程序上的连接，可以使计算机实现单机无法实现的容错和负载均衡。集群技术在企业组织部署关键业务、电子商务与商务流程应用等领域，具有举足轻重的作用。本文主要带领大家一起，参与到集群配置中来，从资料中的配置过程，希望读者朋友能切实了解到集群技术在Windows系统中的具体应用。

创建VMware集群

weixin_54051652的博客

07-04

2970

创建VMware集群

VMware搭建集群环境

逃离人海的博客

10-22

2627

虚拟机搭建k8s环境

详解使用docker搭建hadoop分布式集群

01-11

在网上找了很长时间都没有找到使用docker搭建hadoop分布式集群的文档，没办法，只能自己写一个了。一：环境准备： 1：首先要有一个Centos7操作系统，可以在虚拟机中安装。 2：在centos7中安装docker，docker...

基于Docker搭建Hadoop集群(2).docx

09-06

"基于Docker搭建Hadoop集群" 在本文中，我们将介绍如何基于Docker搭建Hadoop集群。Hadoop是大数据处理的常用工具，而Docker则是当前最流行的容器化技术。通过将Hadoop部署到Docker容器中，我们可以更方便地管理和...

VMware搭建Hadoop集群 for Windows（完整详细，实测可用）_vmware安装hadoop教程

kenzsoft的博客

04-30

2504

SSH服务的作用一般是有两方面：一是便于虚拟机节点之间免密访问，二是传输数据时会有加解密的过程安全性更高。为了这三个节点间免密登录，比如后面在启动hadoop服务时，主节点启动其它从节点，就需要免密去执行。搭建集群需要3个虚拟机，hadoop01，hadoop02，hadoop03，已经安装了hadoop01，剩下两个需要用到虚拟机克隆。下载一个linux版本的JDK，这里是 jdk-8u161-linux-x64.tar.gz，3台机器均要执行以下。最后执行java -version看下是否配置成功。

阿里云环境下搭建HadoopHA集群

weixin_44825085的博客

08-12

2333

阿里云环境下搭建HadoopHA集群 1. HadoopHA介绍 1.1 hadoop高可用集群的简介 hadoop是一个海量数据存储和计算的平台，能够存储PB级以上的数据，并且利用MapReduce可以对这些数据进行并发式计算；hadoop平台采用的是主从式架构（master/slave）即一个master和若干个slave，这个master就是namenode节点，该节点负责存储和管理元数据、配置副本策略、管理数据块的映射信息以及处理客服端的读写请求，由此可见namenode节点的压力还是比较大；

VM桌面虚拟化集群建设

yuezhilangniao的博客

10-08

765

包括VM整个集群的建设（这个链接前后文章有十几篇讲的很详细包括vcentetserver 以及vm虚拟桌面都有了 https://www.cnblogs.com/zb9222/p/5935838.html 链接存储https://blog.51cto.com/10006647/2425629 ...

使用VM搭建分布式集群环境

红豆半升的博客

10-24

927

一、工具 VM9+CentOS7+Xshell CentOS7: http://isoredirect.centos.org/centos/7/isos/x86_64/ Xshell: https://pan.baidu.com/s/1hODydjhblWAtIkrZ7PBgNA 密码：b47l 二、集群搭建新建虚拟机（以下均master机为例，slave机通过克隆获取） 1、新建虚...

FreeVM集群的建立

mwmbfh的博客

07-30

938

FreeVM系统，集群的建立和查看。

VM虚拟机网络配置，集群搭建

xyc1211的博客

09-15

6630

VM虚拟机安装Linux系统不做介绍，主要记录本机与虚拟机的网络配置目录原理安装VM后本地网络会出现两个虚拟网卡虚拟机有3种网络模式可选原理安装VM后本地网络会出现两个虚拟网卡 VM在这里编辑虚拟网络虚拟机有3种网络模式可选选择桥接模式，通过虚拟的网桥，机器的真实网卡进行上网，让虚拟机成为一台和主机相同地位的机器联网选择仅主机模式， linux虚拟机就会连上VMware Network Adapter VMnet1虚...

VMware搭建本地集群环境

gg_xiajie的博客

06-20

2658

VMware搭建本地集群环境 Java准备转型大数据，下班自己练习，从hadoop入手，首先搭建集群环境，记录一下安装历程一、虚拟机的安装系统环境：Windows 10 虚拟机软件选择：VMware® Workstation 16 Pro 虚拟机镜像：CentOS-7-x86_64-DVD-2003 附加镜像：cn_windows_7_ultimate_with_sp1_x64_dvd_u_677408 1、新建虚拟机 1、VMware创建新的虚拟机 2、点击下一步：硬件兼容性根据你的VM版本选择

Vmware搭建hadoop集群（一）

qq_34427777的博客

03-15

5337

Vm搭建hadoop集群 1软件准备 1.虚拟机VMware 2.操作系统CentOS 7 3.远程控制虚拟机的终端xshell 4.jdk-8u162-linux-x64.tar.gz 5.hadoop-3.1.3.tar.gz 链接: https://pan.baidu.com/s/1zWzn4beB5ZtAH42a-VWeSQ 提取码: qpd5 VMware和xshell傻瓜式安装不在赘述安装规划如下 2.在虚拟机中安装CentOS操作系统 2.1新建虚拟机 2.2选择镜像文件 2.3选择

一文搞定使用vm搭建Hadoop集群

m0_64787068的博客

03-17

1363

安装vm，后创建3台虚拟机；安装完成我们设置下网关启动三台虚拟机。配合固定ip地址进入修改IP地址的原文件重新启动网关Windows配置主机名的映射linux配合主机名的映射配置ssh免密登录此步可省去此处已规范来讲的话需要，在公司中不建议你使用root去启动Hadoop或者其他项目等，所有此处建议创建新用户去启动。

VMware搭建Hadoop集群 for Windows（完整详细，实测可用）

最新发布

06-13

### Hadoop 集群在 VMware 16.2.5 上的安装与配置指南在 VMware 16.2.5 环境中搭建 Hadoop 集群需要经过多个步骤，包括虚拟机环境准备、网络配置、免密登录设置以及 Hadoop 的安装与配置。以下是详细的说明： #### 1. VMware 环境准备确保 VMware 工具已正确安装，并创建至少三台虚拟机（例如：Hadoop1、Hadoop2 和 Hadoop3）。每台虚拟机应配置足够的 CPU、内存和磁盘空间以支持集群运行[^1]。 #### 2. 虚拟机克隆与网络配置使用 VMware 的克隆功能复制主节点（Hadoop1）到其他节点（Hadoop2 和 Hadoop3）。为每个虚拟机分配静态 IP 地址，并确保所有节点可以通过主机名互相访问。编辑 `/etc/hosts` 文件以映射主机名与 IP 地址的关系： ```bash 192.168.1.101 hadoop1 192.168.1.102 hadoop2 192.168.1.103 hadoop3 ``` #### 3. 免密登录配置在主节点（Hadoop1）生成 SSH 密钥对，并将其公钥分发到所有节点： ```bash ssh-keygen -t rsa ssh-copy-id hadoop2 ssh-copy-id hadoop3 ``` 验证免密登录是否成功： ```bash ssh hadoop2 ssh hadoop3 ``` 如果无需输入密码即可登录，则配置完成[^1]。 #### 4. JDK 安装在所有节点上安装 Java 开发工具包（JDK）。可以使用以下命令安装 OpenJDK： ```bash sudo apt update sudo apt install openjdk-8-jdk ``` 确认 JDK 版本： ```bash java -version ``` #### 5. Hadoop 安装下载并解压 Hadoop 安装包到指定目录： ```bash wget https://archive.apache.org/dist/hadoop/common/hadoop-3.3.1/hadoop-3.3.1.tar.gz tar -xvzf hadoop-3.3.1.tar.gz -C /usr/local/ ``` 将 Hadoop 添加到系统路径： ```bash export PATH=$PATH:/usr/local/hadoop-3.3.1/bin export PATH=$PATH:/usr/local/hadoop-3.3.1/sbin ``` #### 6. Hadoop 配置文件修改编辑 Hadoop 的核心配置文件 `core-site.xml`、`hdfs-site.xml` 和 `mapred-site.xml`。例如，在 `core-site.xml` 中设置 NameNode 地址： ```xml <configuration> <property> <name>fs.defaultFS</name> <value>hdfs://hadoop1:9000</value> </property> </configuration> ``` 在 `hdfs-site.xml` 中配置副本数： ```xml <configuration> <property> <name>dfs.replication</name> <value>2</value> </property> </configuration> ``` #### 7. 启动 Hadoop 集群格式化 NameNode 并启动 HDFS 和 YARN 服务： ```bash hdfs namenode -format start-dfs.sh start-yarn.sh ``` 检查集群状态： ```bash jps ``` ### 注意事项 - 确保所有节点的时间同步。 - 配置防火墙规则以允许必要的端口通信。 - 根据实际需求调整 Hadoop 的配置参数。