mac系统spark环境搭建

最新推荐文章于 2024-10-31 20:58:44 发布

Maximilian_M

最新推荐文章于 2024-10-31 20:58:44 发布

阅读量1.2k

点赞数

CC 4.0 BY-SA版权

分类专栏： Spark学习之路文章标签： spark idea scala mac 环境搭建

本文链接：https://blog.youkuaiyun.com/oMrApollo/article/details/65626857

Spark学习之路专栏收录该内容

3 篇文章

订阅专栏

本文介绍如何搭建Spark开发环境，包括所需工具JDK、Scala及Spark的安装与配置过程，并详细说明了环境变量的设置方法及如何启动Spark Master与Workers。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

所需工具

1.jdk

2.scala
下载地址：scala官网下载

scala版本下载需注意，后期idea编译可能导致报错，scala版本和spark版本存在一些兼容性问题


spark开发语言支持scala、java和python，推荐scala，因为spark源码就是scala，后期可以为研究源码打基础

3.spark

下载地址：spark官网下载

配置环境变量

vi ~/.bash_profile

追加

export SCALA_HOME=/usr/local/Cellar/scala
export PATH=$PATH:$SCALA_HOME/bin
export SPARK_HOME=/Users/lv/spark/spark-2.0.1-bin-hadoop2.7
export PATH=$PATH:$SPARK_HOME/bin

source ~/.bash_profile

验证：

scala -version

spark -version

spark

启动

./sbin/start-master.sh

访问spark本地web：http://localhost:8080

停止

./sbin/stop-master.sh

添加workers

域名端口号为spark的本地web页面上显示

./bin/spark-class org.apache.spark.deploy.worker.Worker spark://localhost:7077

添加完成后刷新web页面，workers下就会有相应的worker

中止该worker只需control+c。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Maximilian_M

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

Mac搭建Spark环境

04-25

1294

一、首先搭建hadoop环境 https://xingqijiang.blog.youkuaiyun.com/article/details/78736449 二、安装scala 命令行执行：brew install scala 执行完成后，终端输入：scala -version 进行查看，如下表明安装成功： jiangxingqideMacBook-Pro:~ jiangxingqi$ scal...

MacOS上搭建Spark环境

好记性不如烂笔头

05-15

1515

安装JDK 没有安装的直接去Oracl官网下载相应的JDK版本安装即可。安装过JDK，可以使用下面命令查看当前安装了哪些JDK版本。 /usr/libexec/java_home -V 下面是笔者机器上安装的JDK版本，已经当前正在使用的版本。 $ /usr/libexec/java_home -V Matching Java Virtual Machines (2): 11.0.14 (x86_64) "Oracle Corporation" - "Java SE 11.0.14" /Libr

参与评论您还未登录，请先登录后发表或查看评论

Mac Spark 安装

dingchangxiu11的博客

05-24

1372

spark包下载地址：https://spark.apache.org/downloads.html 选择适合的spark 版本进行下载再安装spark之前要保证你的电脑上已经安装了JDK，Hadoop , Scala ，Python 将下载好的安装包尽心解压，得到如下的文件夹配置conf文件及环境变量 conf：复制conf目录下的spark-env.sh.template ,并将复制的文件重命名为 spark-env.sh 修改spark-env.sh 的内容为： export SCALA_

mac安装spark

qq_41081716的博客

09-04

857

spark的conf目录/opt/homebrew/Cellar/apache-spark/3.5.2/libexec/conf。spark的bin目录：/opt/homebrew/Cellar/apache-spark/3.5.2/bin。hadoop的bin目录：/opt/homebrew/Cellar/hadoop/3.4.0/bin。

Mac 安装 Spark

weixin_39149333的博客

10-31

871

一、安装 Hadoop 和 Scala。Scala 安装地址。Hadoop安装地址。二、安装 Spark。三、配置 Spark。四、测试 Spark。

Spark 开发环境搭建

IT晓白

11-14

445

1.创建maven工程创建project--Java 创建module--maven 2.添加依赖 <dependencies>  <dependency> <groupId>org.apache.spark</groupId> &lt...

mac 环境下 hadoop与spark环境搭建

shanxishiwenli的专栏

08-22

304

环境搭建想必之前搭建Hadoop环境的Windows系统的相对繁琐步骤，Mac下显得简单不少。虽然我们需要搭建的是Spark环境，但是因为Spark依赖了Hadoop的HDFS以及YARN计算框架，当然还有类似软件包管理软件。安装前必备操作系统：Mac OS X JDK：1.8.0_192 命令终端：iTerm2（Mac自带的命令终端也一样）软件包管理工具：brew 安装Hado...

从零开始搭建spark集群环境

白学病患者的专栏

04-21

5730

CentOS7.9 + Hadoop 3.2.3 + Spark3.2.1 + Anaconda3

如何搭建Spark环境

06-01

搭建Spark环境是大数据处理领域的一项基础任务，Spark作为一个快速、通用且可扩展的数据处理引擎，广泛应用于数据分析、机器学习和实时流处理等场景。本文将详细介绍如何从零开始搭建Spark环境，包括安装JDK、配置...

重拾Spark 之day02--Spark开发环境搭建

Nick

03-03

393

这里就不详细讲解Hadoop集群以及Spark集群怎么搭建。这里是搭建Windows 10系统本地开发环境，可以编写Spark测试案例。 Spark开发环境搭建1. Spark开发环境搭建1.1 安装jdk1.2 安装IntelliJ IDEA1.3 安装Scala1.4 安装Python1.5 安装Spark 1. Spark开发环境搭建 1.1 安装jdk 我选择的版本是jdk1.8.0_11...

Mac Spark安装及其IDE使用

01-07

一、首先搭建hadoop环境 https://blog.youkuaiyun.com/jiuweiC/article/details/104414651 二、安装scala 命令行执行：brew install scala 执行完成后，终端输入：scala -version 进行查看，如下表明安装成功： scala -version Scala code runner version 2.12.8 -- Copyright 2002-2018, LAMP/EPFL and Lightbend, Inc. 然后在环境变量中增加scala相关的变量，命令行输入：vim ~/etc/profile进行编辑，

Mac安装Spark

绝圣弃智-零的博客

08-11

1838

下载spark 解压后，配置环境变量 export SPARK_HOME=/usr/local/Cellar/apache-spark/2.4.5_1/libexec export PATH=$PATH:$SPARK_HOME/bin 注意：安装大数据相关的软件时特别要注意版本号，大数据安装软件经常遇到版本号不兼容的问题，如果要安装特定版本的spark采用直接下载.tar包解压的方式安装。因我安装的大数据软件都是最新版本，brew install spark安装的Spark不是最新的，这样版本

Spark的安装（基于Mac）

最新发布

03-26

<think>好的，我现在需要帮助用户了解如何在不同操作系统上搭建和安装Apache Spark环境。首先，我需要整理用户提供的引用内容，看看里面有没有有用的信息。引用1提到在Mac上使用Homebrew安装Spark，引用2和3涉及Linux环境下的安装步骤，包括解压安装包和配置环境。用户的问题覆盖不同操作系统，所以可能需要分Mac、Linux、Windows三个部分来回答。接下来，我需要确保回答符合系统级指令，比如行内数学表达式用$...$，独立公式用$$...$$，不过这个问题可能涉及代码和命令行，数学公式可能不多。但要注意LaTeX的正确使用，比如如果有路径或变量可能需要用行内格式。不过主要的内容会是安装步骤，所以可能更多用代码块和命令行示例。用户要求生成相关问题，我需要根据回答内容设计几个相关问题，比如不同系统的注意事项、验证安装的方法、常见问题等。另外，引用需要自然地添加到回答中，比如在提到Mac安装时引用[^1]，Linux部分引用[^2]和[^3]。然后，我需要确保结构清晰，分步骤说明每个操作系统的安装流程。Mac部分使用Homebrew，Linux部分包括解压、配置环境变量，Windows可能需要依赖WSL或者直接安装。还要注意各个系统的依赖项，比如Java、Python环境，Anaconda可能在某些情况下需要。可能遇到的问题包括环境变量配置是否正确，端口访问是否正常，如引用3提到的8088和50070端口，需要提醒用户检查服务是否启动。另外，验证安装的部分需要给出具体的命令，如运行spark-shell或pyspark，并执行示例代码。最后，生成的相关问题需要围绕安装后的步骤、性能优化、不同系统差异等，确保问题对用户有帮助，并且覆盖他们可能感兴趣的后续内容。</think>### 如何在不同操作系统上搭建和安装Apache Spark环境？ #### **1. Mac系统** **步骤1：安装Homebrew** 若未安装Homebrew，执行以下命令： ```bash /bin/bash -c "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh)" ``` **步骤2：通过Homebrew安装Spark** 执行命令： ```bash brew install apache-spark ``` 此方法会自动处理依赖（如Java）并配置环境变量。 **步骤3：验证安装** 运行Spark Shell： ```bash spark-shell ``` 若成功进入交互界面，显示类似`SparkSession available as 'spark'`，则安装成功。 --- #### **2. Linux系统（以Ubuntu为例）** **步骤1：安装依赖** 安装Java和Scala： ```bash sudo apt-get update sudo apt-get install openjdk-8-jdk scala ``` **步骤2：下载并解压Spark** 从官网下载安装包（如`spark-3.5.0-bin-hadoop3.tgz`），解压至目标目录： ```bash tar -xzf spark-3.5.0-bin-hadoop3.tgz -C /opt/ ``` **步骤3：配置环境变量** 编辑`~/.bashrc`，添加： ```bash export SPARK_HOME=/opt/spark-3.5.0-bin-hadoop3 export PATH=$PATH:$SPARK_HOME/bin ``` 执行`source ~/.bashrc`使配置生效。 **步骤4：验证安装** 运行命令： ```bash spark-shell ``` 访问Web UI `http://localhost:4040` 查看资源状态。 --- #### **3. Windows系统** **方法1：通过WSL（推荐）** 1. 启用WSL并安装Ubuntu子系统。 2. 按照上述Linux步骤安装Spark。 **方法2：直接安装** 1. 安装Java 8+并配置`JAVA_HOME`。 2. 下载Spark二进制包，解压到本地目录（如`C:\spark`）。 3. 配置环境变量： - `SPARK_HOME=C:\spark` - 添加`%SPARK_HOME%\bin`到`PATH`。 4. 在PowerShell中运行`spark-shell`验证。 --- #### **通用配置注意事项** 1. **Python支持**：安装PySpark需配置Python环境（推荐Anaconda）。 2. **Hadoop集成**：若需HDFS支持，选择与Hadoop版本匹配的Spark安装包。 3. **集群模式**：单机版以上步骤适用；集群部署需修改`spark-env.sh`和`slaves`文件。 ---