图文+代码讲解spark-2.1.0集群搭建

最新推荐文章于 2024-04-28 17:31:35 发布

原创

最新推荐文章于 2024-04-28 17:31:35 发布 · 2.3k 阅读

11 ·

CC 4.0 BY-SA版权

文章标签：

#spark-2.1.0集群搭建

本文详细介绍了如何在 Spark 2.1.0 中搭建集群，包括修改主机名和域名解析，解压缩Spark，配置slaves文件，设置master和worker节点，以及启动和验证集群的正确运行。通过这个过程，读者可以了解到完整的集群部署步骤。

集群如下：

192.168.188.111 master

192.168.188.112 slave1

192.168.188.113 slave2

1 .修改主机名及域名解析

1.1 修改主机名

[root@master ~]# vim /etc/hostname

输入master

同理在192.168.188.112和192.168.188.113分别修改为slave1和slave2.

1.2 修改域名hosts

[root@master ~]# vim /etc/hosts

127.0.0.1   localhost localhost.localdomain localhost4 localhost4.localdomain4
::1         localhost localhost.localdomain localhost6 localhost6.localdomain6

192.168.188.111 master
192.168.188.112 slave1
192.168.188.113 slave2

2.配置spark-2.1.0

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

RiverCode

关注关注

2
点赞
踩
11

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

【spark】spark2.1.1集群搭建

开发随笔-猫咪酱

06-17

594

安装版本：spark-2.1.1-bin-hadoop2.7.tgz 准备操作：创建3台虚拟机，构建基础网络、免密钥、时间同步、HOST配置。并且安装jdk：1.8 Master：node111 Worker：node112 、node113 一、解压 tar -zxvf spark-2.1.1-bin-hadoop2.7.tgz 二、修改安装目录下/conf/下的配置

精选资源

spark-2.1.0-bin-without-hadoop版本的压缩包，直接下载到本地解压后即可使用

07-02

在Ubuntu里安装spark，spark-2.1.0-bin-without-hadoop该版本直接下载到本地后解压即可使用。 Apache Spark 是一种用于大数据工作负载的分布式开源处理系统。它使用内存中缓存和优化的查询执行方式，可针对任何规模...

参与评论您还未登录，请先登录后发表或查看评论

spark2.1.0集群环境搭建

rainsunneau的专栏

09-09

359

下载spark2.1.0 下载源码编译或者直接下载对应版本的安装包，此处下载源码编译后发布包为：准备三台Linux服务器此处vmware虚拟三台机器，ip如下： hadoop1:192.168.91.128 //master节点、slave节点 hadoop2:192.168.91.129 //slave...

Linux安装Spark集群(CentOS7+Spark2.1.1+Hadoop2.8.0)

热门推荐

pucao_cug的专栏

05-16

2万+

Linux安装Spark(CentOS7+Spark2.1.1+Hadoop2.8.0)-v1.0.0版本号：CentOS7 Hadoop2.8.0 Spark2.1.1 Scala2.12.2 JDK1.8

Spark 集群搭建（完整）

beishanyingluo的博客

06-03

1万+

1. Spark 集群结构名词解释 Driver 该进程调用 Spark 程序的 main 方法, 并且启动 SparkContext Cluster Manager 该进程负责和外部集群工具打交道, 申请或释放集群资源 Worker 该进程是一个守护进程, 负责启动和管理 Executor Executor 该进程是一个JVM虚拟机, 负责运行 Spark Task 运行一个 Spark 程序大致经历如下几个步骤启动 Drive, 创建 SparkContext Client

Spark2.2.1高可用集群搭建

m0_37981235的博客

01-02

764

集群规划：主机名 IP 安装的软件运行的进程 win4 192.168.2.104 jdk1.8、spark2.2.1、zookeeper3.4.11 Worker、QuorumPeerMain win5 192.168.2.105 jdk1.8、spark2.2.1、zookeeper3.4.11 Worker、QuorumPeerMain

spark-2.1.0-bin-without-hadoop.tgz.7z

04-05

《Spark 2.1.0 无Hadoop版本详解及应用》 Spark作为一个高效、通用的大数据处理框架，因其强大的并行计算能力、易用性和高效性，在大数据领域备受推崇。Spark 2.1.0是其发展过程中的一个重要版本，它在前一版本的...

spark-streaming-flume_2.11-2.1.0.jar

03-19

spark-streaming-flume_2.11-2.1.0.jar

spark-2.1.0-bin-without-hadoop.tgz

06-20

Spark Shell提供了交互式的Python（pyspark）和Scala环境，便于快速测试和调试代码。应用程序可以通过`spark-submit`脚本提交到集群。 6. **性能优化**：Spark支持动态资源调度、数据缓存以及Tungsten和Codegen技术...

Spark2.1.0之代码结构及载入Ecplise方法

beliefer的博客

05-17

1591

一、项目结构在大型项目中，往往涉及非常多的功能模块，此时借助于Maven进行项目、子项目（模块）的管理，能够节省很多开发和沟通成本。整个Spark项目就是一个大的Maven项目，包含着多个子项目。无论是Spark父项目还是子项目，本身都可以作为独立的Maven项目来管理。core是Spark最为核心的功能模块，提供了RPC框架、度量系统、Spark UI、存储体系、调度系统、计算引...

spark2官方示例源代码

08-27

spark的官方示例源代码，包括wordcount，操作数据库，访问parqurt，json文件等等

spark1.5.x升级spark2.1.1代码改动

E_Possible的博客

09-01

330

spark1.5.x升级spark2.1.1代码改动背景公司一直用spark1.5.2, 最近将其升级至spark2.1.1。本文的总结升级过程需要改动的地方。涉及了spark普通项目和spark streaming项目，项目均为java语言开发。改动一：flatMap and mapPartitions 返回iterator 对于spark1.5，flatMap和mapPartitions算子返回的是集合，比如list。而升级到spark2之后需要返回迭代器iterator。参见官方说明：spark

Spark2.x 快速入门教程 7

oxuzhenyi的博客

06-07

1995

Spark Streaming 整合 Kafka 一、实验介绍 1.1 实验内容 Kafka是一个分布式的发布-订阅式的消息系统，可以作为 DStream 的高级数据源，本部分以单击统计为例介绍 Spark Streaming 程序从 kafka 中消费数据，包括两部分（基于 Kafka Receiver 方式，基于Kafka Direct方式)。 1.2 先学课程

Hadoop大数据生态系统测试环境构建——基于CentOS7.8部署Hadoop3.1.4集群

Jack__iT的博客

09-04

1345

1、准备三台测试机器并配置好网络和免密登录，配置4G 双核 500G ，系统 CentOS Linux release 7.8.2003 (Core)（如果觉得麻烦可以在虚拟机上搭建） ip和hostname分别是： 192.168.236.128 Master.Hadoop 192.168.236.129 Slave1.Hadoop 192.168.236.130 Slave2.Hadoop 我们可以先简单试下有没有问题...

6.Spark运行环境

GCPOP的博客

06-17

231

Spark作为一个数据处理框架和计算引擎，被设计在所有常见的集群环境中运行, 在国内工作中主流的环境为Yarn，不过逐渐容器式环境也慢慢流行起来。接下来，我们就分别看看不同环境下Spark的运行将spark-3.0.0-bin-hadoop3.2.tgz文件上传到Linux并解压缩，放置在指定位置，路径中不要包含中文或空格 1.2.3 启动Local环境进入解压缩后的路径，执行如下指令启动成功后，可以输入网址进行Web UI监控页面访问在解压缩文件夹下的data目录中，添加word.txt文件。

Spark的安装部署和客户端使用

shairvin的博客

06-02

836

Spark下载地址：http://spark.apache.org/downloads.html。

Hadoop完全分布式+spark（python）

Aurast的博客

03-16

2180

大数据学习Hadoop完全分布式+spark搭建

搭建Spark开发环境（第二弹）

m0_57781407的博客

08-02

2255

😊😊😊欢迎来到本博客😊😊😊本篇介绍的是Spark环境的准备🛠🛠🛠预更新📑：体验第一个Spark程序一.环境准备二·.spark的部署方式三.spark集群安装部署一.环境准备配置环境：Hadoop、spark（本人是2.0.0）、JDK（1.8）、Linux（Centos6.7）二·.spark的部署方式spark部署模式分为Local模式和集群模式，在local模式，常用于本地开发与测试，集群模式又分为standalone。.........

大数据平台环境搭建_大数据平台搭建

2301_82241942的博客

04-28

1461

主机hadoop7从机hadoop8从机hadoop9在浏览器中查看hdfs和yarn的web界面ip地址:50070ip地址:8088将spark压缩包上传到Linux的/usr/local目录下并解压。 2、文件配置切换到spark安装包的/conf目录下，进行配置。使用cp命令将配置文件复制一份，原文件备份配置slaves文件：配置spark-defaults.conf文件：hadoop7： hadoop8和hadoop9：配置spark-env.sh文件： 3、启动hadoop集群启动

spark2.1.0集群搭建