- 博客(2)
- 收藏
- 关注
原创 初级rdd编程
RDD编程初级实践 需求描述 本次实验,我们需要实现的是在Linux系统中执行RDD编程,编写独立应用程序去实现解决以下三个问题。。 问题 ①pyspark交互式编程 请根据给定的实验数据,在pyspark中通过编程来计算以下内容: (1)该系总共有多少学生; (2)该系共开设了多少门课程; (3)Tom同学的总成绩平均分是多少; (4)求每名同学的选修的课程门数; (5)该系DataBase课程共有多少人选修; (6)各门课程的平均分是多少; (7)使用累加器计算共有多少人选了DataBase这门课。 ②
2021-06-09 17:06:55
172
2
原创 Hadoop统计单词作业
hadoop期末作业 声明 本次大作业是通过网上的各种资源的学习以及同学的帮忙才能完成的。 途中因为不太了解Ubuntu的运行流程导致出了很多bug,都是通过慢慢从网上寻找bug的解决方法才能完成的。 执行过程 ①终端进入目录cd /usr/local/hadoop 输入命令 ./sbin/start-dfs.sh 启动hadoop,当程序执行完后,可输入jps查看Hadoop是否启动成功,若出现下图则成功 ②成功启动后,可以通过火狐浏览器访问 Web 界面 http://localhost:50070
2020-12-11 16:56:34
295
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅