目录
(三)新建Maven项目 -- CalulateScoreSum
一、提出任务
成绩表有三条记录,包含四个字段
| 姓名 | 语文 | 数学 | 英语 |
| 刘志斌 | 85 | 76 | 95 |
| 张得之 | 84 | 72 | 66 |
| 马云飞 | 95 | 84 | 95 |
成绩表文件--scoress.txt
刘志斌 85 76 95
张得之 84 72 66
马云飞 95 84 95
使用RDD得到文件results.txt

二、完成任务
启动集群的HDFS与Spark

(一)在/home中写入成绩文件scoress.txt

(二)将成绩文件scoress.txt上传到HDFS

(三)新建Maven项目 -- CalulateScoreSum


创建成功


这篇博客详细介绍了如何使用Spark和Scala处理成绩数据。首先在/home创建并上传成绩文件scoress.txt到HDFS,然后创建Maven项目CalulateScoreSum,改用Scala目录。接着配置依赖和构建插件,确保Spark版本与Scala SDK匹配,创建日志属性文件,最后编写CalculateScoreSum单例对象进行成绩总和计算,并在本地运行验证结果。
最低0.47元/天 解锁文章
938

被折叠的 条评论
为什么被折叠?



