安装Scala
一.官网下载安装Scala:scala-2.12.8.tgz
https://www.scala-lang.org/download/
tar -zxvf scala-2.12.8.tgz -C /opt/module
mv scala-2.12.8 scala
测试:scala -version
启动:scala
安装spark
二.官网下载安装:spark-2.4.2-bin-hadoop2.7.tgz
https://www.apache.org/dyn/closer.lua/spark/spark-2.4.2/spark-2.4.2-bin-hadoop2.7.tgz
解压、重命名
启动spark
1.先启动hadoop 环境
start-all.sh
2.启动spark环境
进入到SPARK_HOME/sbin下运行start-all.sh
/opt/module/spark/sbin/start-all.sh
jps查看
3.启动Spark Shell
三.使用Spark Shell编写代码
读取本地文件
加载hdfs文件
打印文件第一行
用spark shell进词频统计