在Ubuntu上安装Apache Spark的步骤如下:
1. 安装Java
Spark是用Scala编写的,并且依赖Java。因此,首先需要安装Java。
安装OpenJDK 8(或更高版本)
执行以下命令安装OpenJDK:
sudo apt update
sudo apt install openjdk-8-jdk
你可以通过运行以下命令检查Java版本,确保安装成功:
java -version
输出应该显示Java版本信息,例如:
openjdk version "1.8.0_292"
如果没有安装Java 8,你可以选择其他版本(例如OpenJDK 11或OpenJDK 17),但Spark推荐使用Java 8。
2. 安装Scala(可选)
Spark使用Scala作为其默认编程语言,因此最好安装Scala。不过,如果你打算使用PySpark(Python API)或Spark的其他语言API,Scala并不是必须的。
如果你想安装Scala,可以执行以下命令:
sudo apt install scala
3. 下载并安装Spark
-
访问Apache Spark官网并选择你想要的Spark版本。这里选择一个预编译版本(例如,
Spark 3.x
版本)ÿ