Spark环境搭建

最新推荐文章于 2025-07-27 13:40:01 发布

原创最新推荐文章于 2025-07-27 13:40:01 发布 · 424 阅读

0 ·

CC 4.0 BY-SA版权

大数据专栏收录该内容

4 篇文章

订阅专栏

本文详细介绍如何从官网下载Spark安装包并使用WinSCP将其传输至服务器的过程。此外还讲解了如何配置Spark环境，包括修改spark-env.sh及slaves文件的具体步骤。文章提供了全分布式环境下Spark的启动方法，并解释了如何通过浏览器查看启动状态。

1、官网下载安装包再通过WinSCP传到服务器上，并解压

2、进入安装目录并修改配置文件

（1）spark-env.sh 的最后添加(配置信息顾名思义)

export JAVA_HOME=/root/training/jdk1.8.0_144
export SPARK_MASTER_HOST=bigdata11
export SPARK_MASTER_PORT=7077

（2）slaves (配置worker)

ip地址

3、因为Spark的启动命令和Hadoop的启动命令冲突所以不配置环境变量而是在sbin目录下启动

4、查看启动日志，也可以在浏览器通过8080端口(由此可见Spark内置Tomcat服务器)打开查看

5、浏览器

地址栏输入 ip:8080 查看

6、全分布式环境搭建只需要修改在主节点(假设三台机器中的1)上的slave文件，将worker(三台机器中的 2 3)的ip配置上，再将主节点上配置好的Spark安装目录cp到另外两台机器上(需要配置ssh具体参考之前的文章)接着在主节点上执行上面的启动命令即可

scp -r spark-2.1.0-bin-hadoop2.7/ root@ip地址:/root/training

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

奶茶多冰三分糖

关注关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

Spark学习笔记(2)——Spark运行环境部署

m0_56602092的博客

07-28

3454

Spark只是一个数据处理框架和计算引擎，它必须要在一个特定的环境中才能运行。常用的运行环境有如下三种一、 Local模式 Local模式是指不需要任何其它节点资源就可以在本地执行Spark代码的环境，不需要额外的进程进行资源管理，所有程序都运行在本地的一个进程环境中（如jvm)，一般用于教学，调试，演示等。在 IDEA 中运行代码的环境我们称之为开发环境，不太一样。 spark-3.0.0-bin-hadoop3.2.tgz表示的是基于3.2版本的Hadoop编译的spark，所以还需要安装配置had

Spark的集群环境部署

xieyichun_的博客

10-31

1665

分享了spark的两个集群模式的配置方法

参与评论您还未登录，请先登录后发表或查看评论

Linux 之 Spark 环境部署笔记——Spark安装

octdream的专栏

05-30

639

1.下载下载地址：https://archive.apache.org/dist/spark/ 2.解压将安装包放入linux中，然后解压 tar -zxvf spark-1.6.0-bin-hadoop2.6.tgz 修改文件夹名称 mv spark-1.6.0-bin-hadoop2.6 spark-1.6.0 3.环境配置 1）进入编辑 sudo vi /etc/profile 2）配置如下环境变量 export SPARK_HOME=/vol6/home/nud

Spark编译与部署（上）--基础环境搭建

yyy

09-09

1366

spark 环境部署

2301_76821351的博客

04-03

1695

.Anaconda On Linux 安装 (单台服务器) Spark Local模式部署（提前开好hadoop） Spark StandAlone环境部署（提前开好hadoop） Spark On YARN 环境搭建(提前开好hadoop)

spark环境搭建

01-22

Spark 环境搭建 Spark 环境搭建是指在本地机器上安装和配置 Spark 相关组件，以便进行 Spark 的学习和开发。本文将指导读者从头开始搭建 Spark 环境，包括 JDK 安装、Spark 下载、Scala 安装、Hadoop 安装和 Spark ...

Spark环境搭建流程

qq_57174393的博客

04-21

1923

spark安装测试

spark环境搭建和配置

03-02

Spark环境搭建和配置的具体步骤包括以下知识点： 1. Spark组件下载：可以通过网盘分享链接下载Spark组件压缩包，链接和提取码通常由分享者提供。 2. 虚拟机安装：首先，需要在VMware虚拟机上新建虚拟机，选择典型...

Spark环境部署

Java

06-22

259

一、安装解压压缩包 tar -zxvf spark-2.3.2-bin-hadoop2.7.tgz -C /export/servers/ 修改三个文件 spark-env.sh slaves /etc/profile (1）spark-env.sh 将conf/spark-env.sh.template配置模板文件复制一份并命名为spark-env.sh 修改spark-env.sh文件，在该文件添加以下内容(根据自己的配置进行修改） vim spark-env.sh

Spark 运行环境部署

Made In SQL

07-27

1036

【代码】Spark 运行环境部署。

Spark环境搭建与配置

2501_90817124的博客

03-11

1348

Spark组建的下载地址：通过网盘分享的文件：soft链接pwd=2wvh提取码: 2wvh如果前期安装过程有错，可以删除虚拟机重装，先关闭虚拟机，点击上方虚拟机，点击管理，再点击从磁盘中删除，点击确定就可以了。考虑到本虚拟机要运行hadoop和spark等程序，内存数量必须要2GB以上，不然会出现蓝屏或者崩溃现象。

SPARK环境搭建

lili_wuwu的博客

09-11

218

准备工作一套搭建好的hadoop环境下载scala、spark安装包 1、安装scala tar -xzvf scala-2.12.3.tgz 2、安装spark tar -xzvf spark-2.2.0-bin-hadoop2.7.tgz 3、修改、/etc/profile文件 JAVA_HOME=/usr/java/jdk1.8.0_144/ HADOOP_HOME...

单机部署spark环境

Alex的博客

08-27

3279

最近需要搭建单机版sprak环境，分享一下： 1.首先准备软件包下载地址：https://www.apache.org/dyn/closer.lua/spark/spark-2.4.3/spark-2.4.3-bin-hadoop2.7.tgz 2.解压到对应目录后，修改配置文件（前提Java已经安装过了）解压的Linux命令：tar -zxvfspark-2.4.3-bin-...

【Spark生态】--Spark环境搭建

weixin_52854743的博客

06-27

2008

Spark环境安装部署，Local模式和PySpark库的安装

spark环境安装

l576754326的博客

01-13

1378

第三方教程提供

Spark环境搭建（保姆级教程）

最新发布

09-23

Spark环境搭建与测试可按以下步骤进行： ### 一、Spark软件安装 1. **安装包上传并解压**：如使用命令 `tar -zxvf spark - 3.5.2 - bin - hadoop3.tgz -C /export/servers/` 进行解压操作 [^3]。 2. **Spark文件夹更名**：完成解压后，可根据需要对Spark文件夹进行更名操作。 3. **目录结构说明**：了解Spark解压后目录的各个文件夹和文件的作用。 4. **测试**：对安装的Spark软件进行初步测试，确保安装正常。 ### 二、PySpark环境安装 1. **下载Anaconda环境包**：为PySpark提供合适的Python环境支持。 2. **安装Anaconda环境**：按照Anaconda的安装流程完成安装。 3. **启动Anaconda并测试**：启动Anaconda并进行简单测试，确保其能正常运行。 4. **PySpark安装**：在Anaconda环境中完成PySpark的安装。 ### 三、Spark on Yarn环境搭建 1. **修改spark - env.sh**：对该配置文件进行修改以适配Yarn环境。 2. **修改hadoop的yarn - site.xml**：调整Hadoop的Yarn相关配置。 3. **Spark设置历史服务地址**：设置Spark历史服务的地址。 4. **配置依赖spark jar包**：确保Spark运行所需的依赖jar包配置正确。 5. **启动服务**：依次启动相关服务，如Hadoop、Spark等。 6. **提交测试**：提交一个测试任务，验证Spark on Yarn环境是否搭建成功。 ### 测试示例代码以下是一个简单的Python代码示例，用于测试Spark环境： ```python from pyspark.sql import SparkSession # 创建SparkSession spark = SparkSession.builder \ .appName("SparkTest") \ .getOrCreate() # 创建一个简单的DataFrame data = [("Alice", 25), ("Bob", 30)] columns = ["Name", "Age"] df = spark.createDataFrame(data, columns) # 显示DataFrame内容 df.show() # 停止SparkSession spark.stop() ```