spark单机安装

原创已于 2025-08-08 10:43:51 修改 · 508 阅读

3 ·

CC 4.0 BY-SA版权

快乐的小阿白

文章标签：

#spark #大数据 #分布式

于 2024-09-14 13:42:55 首次发布

spark安装

下载
解压
修改配置文件
验证
执行scala小例子
退出spark-shell

需要安装hadoop

hadoop单机版安装

下载

wget https://mirrors.tuna.tsinghua.edu.cn/apache/spark/spark-3.5.2/spark-3.5.2-bin-hadoop3-scala2.13.tgz

mv spark-3.5.2-bin-hadoop3-scala2.13.tgz /opt/soft

解压

tar -zxvf spark-3.5.2-bin-hadoop3-scala2.13.tgz 
mv spark-3.5.2-bin-hadoop3-scala2.13 spark

修改配置文件

cp spark-env.sh.template spark-env.sh

echo $HADOOP_HOME #查看hadoop环境变量
#添加 
export SPARK_DIST_CLASSPATH=$(/usr/local/hadoop/bin/hadoop classpath)

验证

bin/spark-shell #启动spark

启动进入scala交互

执行scala小例子

// 创建一个包含测试文本的RDD  
val textRDD = sc.parallelize(Seq("Hello Spark", "Spark is fun", "Big Data Processing"))  
  
// 对文本进行简单的转换操作，比如转换为大写  
val upperRDD = textRDD.map(_.toUpperCase())  
  
// 收集并打印结果  
upperRDD.collect().foreach(println)