文章目录 一、提出任务 二、准备工作 (一)启动HDFS服务 (二)启动Spark服务 三、实现步骤 (一)在Spark Shell里完成任务 (二)编写Scala程序完成任务 1、创建Maven项目 - `RDDDemo` 2、添加对hadoop、scala和spark的依赖 3、给Maven项目配置Scala SDK 4、创建`CalculateSum`单例对象 5、运行程序,查看结果 6、安装配置scala-2.12.14 7、更改项目使用的Scala SDK 8、将项目打成jar包 - RDDDemo.jar 9、将RDDDemo.jar包上传到虚拟机 10、将jar包提交到Spark服务器运行 11、在HDFS上查看程序运行结果 一、提出任务 针对成绩表,计算每个学生总分 姓名 语文 数学 英语 张钦林 78 90 76 陈燕文 95 88 98 卢志刚 78 80 60 二、准备工作 (一)启动HDFS服务 执行命令:start-dfs.sh (二)启动Spark服务 进入Spark的sbin目录执行命令:./start-all.sh