- 博客(2)
- 收藏
- 关注
原创 RDD编程
RDD编程初级实践实验目的实验平台实验内容和要求实验结果实验总结参考文献 实验目的 熟悉Spark的RDD基本操作及键值对操作; 熟悉使用RDD编程解决实际具体问题的方法。 实验平台 物理机:Windows主机 虚拟机:Oracle VM VirtualBox 操作系统:Ubuntu18.4 Spark版本:2.4.0 Python版本:3.7.0 实验内容和要求 1.pyspark交互式编程 下载chapter4-data1.txt,该数据集包含了某大学计算机系的成绩,数据格式如下所示: Tom,Data
2021-06-10 14:23:31
359
1
原创 大数据
大作业大数据配置环境 大数据 你好! 这是我第一次使用 Markdown编辑器 所展示的欢迎页。 配置环境 1.配置好环境,准备一个英文文档,将英文文档上传到hdfs: 查看HDFS中的文件内容 使用hadoop运行wordcold文件: 运行过程: 运行结果: ...
2020-12-25 19:43:00
116
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅