docker 简单搭建hadoop环境

Docker快速搭建Hadoop开发环境

最新推荐文章于 2024-12-28 12:38:19 发布

原创最新推荐文章于 2024-12-28 12:38:19 发布 · 1.4k 阅读

5 ·

CC 4.0 BY-SA版权

hadoop 专栏收录该内容

1 篇文章

订阅专栏

本文介绍了如何使用Docker便捷地创建一个Hadoop开发环境。通过拉取sequenceiq/hadoop-docker:2.7.1镜像，启动容器，并运行示例任务，如grep操作，然后展示如何查看输出结果以及监控YARN和NameNode的Web页面。这是一个适合初学者的学习教程。

使用 docker简单搭建 hadoop开发环境，用于学习

1、拉取 hadoop镜像

这里使用 sequenceiq/hadoop-docker:2.7.1

docker pull sequenceiq/hadoop-docker:2.7.1

2、开启容器

docker run --name=my-hadoop -it -p 50070:50070 -p 8088:8088 -p 50075:50075 -p 9000:9000 sequenceiq/hadoop-docker:2.7.1 /etc/bootstrap.sh -bash --privileged=true

开启容器后会直接进入hadoop容器

3、运行示例

进入 /usr/local/hadoop-2.7.1 目录

cd /usr/local/hadoop-2.7.1

运行示例

bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.1.jar grep input output 'dfs[a-z.]+'

运行完成

查看输出结果

bin/hdfs dfs -cat output/*

4、yarn任务监控 web页面

笔者这里宿主机器 ip 是 192.168.0.118

yarn任务监控 web页面地址是：http://192.168.0.118:8088

5、namenode web页面

地址：http://192.168.0.118:50070

6、datanode web页面

地址：http://192.168.0.118:50075

至此完

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

悟世君子

关注关注

1
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
打赏
打赏
打赏举报

举报

专栏目录

使用docker部署hadoop集群

upupfeng的博客

09-04

5606

使用docker快速搭建一主两从的hadoop集群。

使用 Docker 部署 Hadoop 集群

最新发布

Petmaddox的博客

10-08

1317

虚拟机（Virtual Machine, VM）是通过软件模拟物理计算机硬件运行环境的程序或系统，允许多个操作系统在同一物理机上同时运行。其通过虚拟化技术抽象物理资源（CPU、内存等），为每个虚拟机提供独立环境，彼此隔离。类型：系统虚拟机（如 VMware、VirtualBox，可运行完整操作系统）和进程虚拟机（如 Java 虚拟机，用于特定应用）。优势：资源利用率高、灵活性强、易于管理，适用于服务器虚拟化、开发测试等场景。VMware 安装保姆级教程。

参与评论您还未登录，请先登录后发表或查看评论

ubuntu基于docker搭建hadoop集群【史上最详细】

web18536560468的博客

08-26

1708

（5）到这里，还差最后一个配置就要完成hadoop集群配置了，打开h01上的workers文件(把原先的默认值localhost删掉，输入三个slave的主机名:h02,h03)（5）打开mapred-site.xml，添加下面的语句。（1）打开hadoop-env.sh，添加下面的语句。（2）打开core-site.xml，添加下面的语句。（4）打开hdfs-site.xml，添加下面的语句。（6）打开yarn-site.xml，添加下面的语句。（1）打开3个终端，分别输入以下命令，创建并启动容器。...

使用 Docker 搭建 Hadoop 集群

撕得失败的标签的博客

12-28

4375

后面如果重新安装系统或者重新安装了 Docker Desktop，只要保留这两个目录下的文件，则原来的所有配置及数据都可以还原。在安装基本软件后，可以 Debian 的软件源切换到国内，以提高后续软件安装的速度，减少等待时间，提高效率。下面以阿里云为例，地理位置也可切换为其它的源，例如腾讯，华为，清华。为了减少重复工作，可以将集群存储与计算环境中的常用组件全部安装好，并提交到 Docker Server 中，后续容器在些镜像上创建。4）将公钥拷贝到要免密登录的目标机器上，各自文件下（不知道密码使用。

使用 Docker 搭建 Hadoop 分布式环境

热门推荐

王清欢的博客

07-21

1万+

对大数据初学者来说，直接用多台物理机搭建Hadoop集群是一个相当痛苦的过程，大多情况下还没开始跑wordcount，可能就被环境搭建劝退了。除了物理机，虚拟机搭建也是一种常见的方式，但这对宿主机也有着很大的性能要求。本文的目标是将Hadoop集群运行在Docker容器中，使Hadoop开发者能够快速便捷地在本机搭建多节点的Hadoop集群。快来学习吧 ~...

使用docker搭建hadoop环境

youcanyouup

06-01

1111

hadoop 一、搭建Hadoop环境我使用docker搭建hadoop环境（mac电脑），具体过程如下：（1）使用homebrew安装docker 使用命令：brew cask install docker （2）在docker上安装hadoop 搜索hadoop：命令docker search hadoop 安装stars最多的那个：命令docker pull sequenceiq/h...

精选资源

详解从 0 开始使用 Docker 快速搭建 Hadoop 集群环境

01-10

Docker 本身就是基于 Linux 的，所以首先以我的一台服务器做实验。虽然最后跑 wordcount 已经由于内存不足而崩掉，但是之前的过程还是可以参考的。连接服务器使用 ssh 命令连接远程服务器。 ssh root@[Your IP ...

精选资源

基于docker一键搭建hadoop环境.zip

03-13

人工智能-hadoop

Docker容器搭建Hadoop集群(hadoop-3.1.3)

2202_75688394的博客

04-20

3598

Docker容器环境下搭建Hadoop集群（完全分布式） hadoop版本为hadoop-3.1.3

精选资源

mac上基于docker搭建hadoop集群

01-20

对各个节点指定好功能 maseter为主节点，hadoop01 为从节点和datanode hadoop02 为yarn主节点负责各个节点的资源调度, hadoop02，hadoop03为datanode节点 OS hostname IP Centos8 hadoop-master ...

基于docker技术搭建Hadoop与MapReduce分布式环境

Dragon_qing的博客

04-25

4207

基于docker技术搭建Hadoop与MapReduce分布式环境安装docker宿主环境确认整备安装环境安装docker测试docker是否能够正常抓取镜像和运行基于docker技术搭建hadoop与map reduce整备容器环境配置ssh服务器安装JDK 8保存镜像安装hadoop为hadoop指定jdk位置hadoop联机配置MapReduce配置服务启动权限配置启动hadoop，并进行网络配置启动hadoop运行MapReduce自带的示例程序注意让Name Node退出安全模式如何批量删除已经退

黑猴子的家：Docker 搭建Hadoop完全分布式

黑猴子的博客

04-30

625

1、拉取centos基础镜像 [root@hadoop108 ~]# docker pull centos:7.5.1804 2、创建centos-jdk:1.0 镜像 [root@hadoop108 software]# mkdir docker-jdk [root@hadoop108 software]# cd docker-jdk [root@hadoop108 docker-jdk]# t...

利用docker搭建hadoop的开发环境（simple）

liyabing1的博客

04-02

566

前言本文是基于ubuntu环境完成的，要完成hadoop的安装，必须先在ubuntu上安装docker, 一、下载hadoop镜像 1、换到root用户执行su root 这样做是方便执行命令 2、下载镜像执行docker sea...

Docker配置Hadoop环境搭建

qq_35260061的博客

04-28

1418

1.Docker配置Hadoop环境搭建 Hadoop集群环境配置起来相当繁琐，并且在学习Hadoop过程中没有一般不会去使用多台设备进行分布式集群配置。因此在一台机器上配置Hadoop分布式集群时通常采用虚拟机来模拟多台设备，但虚拟机较为占用系统资源，开多个虚拟机(模拟Hadoop集群通常使用3个，一个master，两个slave)对内存要求比较高。 lk-linux:192.168.86.157 lk-linux2:192.168.86.158 lk-linux3:192.168.86.159..

Docker安装Hadoop

weixin_33775572的博客

05-10

367

一、概述形成了安装有vim、jdk、ssh的centos镜像，现在我们在这个的基础上继续搭建haoop。在正式开始前，了解一些docker容器的操作命令 docker ps：查看活动的容器 docker ps -a：查看所有的容器（包括终止状态的） docker images：查看镜像 docker run：基于镜像新建一个容器 docker container s...

docker搭建hadoop集群环境之hadoop配置

qq_43506532的博客

10-21

516

一、配置hadoop环境(5个节点均进行此操作) 进入/root/hadoop/etc/hadoop目录 cd /root/hadoop/etc/hadoop 在hadoop-env.sh,mapred-env.sh,yarn-env.sh中加入JAVA_HOME vim hadoop-env.sh vim mapred-env.sh vim yarn-env.sh export JAVA_HOME=/root/jdk11 修改配置文件core-site.xml、dfs-site.xml、mapr

基于docker的Hadoop完全分布式开发环境使用和配置

欢迎订阅 -- 小源笔迹

09-26

1815

之前基于docker搭建了Hadoop完全分布式架构，现在来试试如何使用．基于docker搭建了Hadoop完全分布式架构 Hadoop简单介绍可能有的人目前为止对hadoop还不是太了解，首先进行简单的介绍.大白话，简单来说，hadoop就是个分布式文件系统．要了解的有三部分，１．hdfs(分布式文件系统), ２．mapreduce(面向大数据并行处理的计算模型、框架和平台), ３．yarn...

docker配置全分布式hadoop（5台容器两台主节点，三台从节点）

2301_79917907的博客

05-11

1623

主节点, 运行NameNode和ResourceManager: 主节点, 运行SecondaryNameNode: 从节点, 运行DataNode和NodeManager。

docker安装hadoop环境

susu1083018911的博客

11-28

1723

docker安装hadoop环境

使用Docker快速搭建Hadoop集群环境教程

"这篇文章主要讲解如何使用Docker从零...使用Docker搭建Hadoop集群简化了传统方法的复杂性，使得在本地或远程服务器上快速测试和部署Hadoop环境变得容易。通过以上步骤，开发者可以高效地学习和实践Hadoop大数据处理。