目录
一、提出任务
从python.txt、spark.txt、django.txt三科成绩表中计算每个学生三科平均分
在master
虚拟机上创建三个成绩文件
- django成绩表 :django.txt
1 张三丰 90
2 李孟达 85
3 王晓凯 87
4 黄德耀 93
5 罗萌萌 65
6 李新宇 76
7 王德志 78
8 张章雨 60
9 郭孟德 94
- python成绩表 :python.txt
1 张三丰 80
2 李孟达 65
3 王晓凯 77
4 黄德耀 83
5 罗萌萌 62
6 李新宇 70
7 王德志 68
8 张章雨 80
9 郭孟德 91
- java成绩表:java.txt
1 张三丰 95
2 李孟达 86
3 王晓凯 84
4 黄德耀 76
5 罗萌萌 92
6 李新宇 72
7 王德志 86
8 张章雨 90
9 郭孟德 61
启动集群的HDFS与Spark
将成绩文件 -
java.txt、django,txt、java.txt
上传到HDFS上/score
目录
查看三个成绩文件内容
二、完成任务
(一)新建Maven项目
将java
目录改成scala
目录
(二)添加相关依赖和构建插件
在pom.xml
文件里添加依赖与Maven构建插件
<?xml version="1.0" encoding="UTF-8"?>
<project xm