以下内容只针对 Win10 系统
1. 环境安装
(1) 安装Java
并配置环境变量
https://www.oracle.com/java/technologies/downloads/#java8-windows
(2) 安装Scala
https://www.scala-lang.org/ 或 https://github.com/lampepfl/dotty/releases/tag/3.2.2
配置环境变量,在系统环境变量path
中新增D:\app\Scala\scala3-3.2.2\bin
完成后打开cmd
输入scala
测试一下
(3) 安装Spark
前往链接 spark doanload page 安装
点击进入下一个页面,下载压缩包文件spark-3.4.0-bin-hadoop3.tgz
将文件解压到你想要的文件夹目录中,我的是这样子的
接着配置环境变量,在系统变量中新增以下配置。变量名一定要命名为SPARK_HOME
,否则接下来运行程序的时候会因为找不到这个变量而出错
在环境变量path
中新增以下配置
CMD
中输入spark-shell
看看成功了没
(4) 安装Hadoop
https://www.apache.org/dyn/closer.cgi/hadoop/common/hadoop-3.2.4/hadoop-3.2.4.tar.gz
配置环境变量,在系统变量中新增以下配置。变量名一定要命名为HADOOP_HOME
,变量值替换为你安装hadoop
的目录
在path
中添加以下配置
接下来前往