【Spark】Standalone集群模式安装部署

本文详细介绍Spark集群的standalone模式部署步骤,包括环境搭建、配置修改、集群启动与测试,以及如何通过集群模式运行Spark程序进行大数据计算。
  • 集群角色介绍

Spark是基于内存计算的大数据并行计算框架,实际中运行计算任务肯定是使用集群模式,那么我们先来学习Spark自带的standalone集群模式了解一下它的架构及运行机制。Standalone集群使用了分布式计算中的master-slave模型

master:集群中含有master进程的节点

slave:集群中的worker节点含有Executor进程

 

  • Spark架构图

http://spark.apache.org/docs/latest/cluster-overview.html

 

  • 集群规划

node01:master

node02:slave/worker 

node03:slave/worker

 

  • 下载Spark安装包

下载地址:http://spark.apache.org/downloads.html

 

  • 上传安装包
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值