Sunshine_PUBG-优快云博客

原创 2021-06-10

1、需求描述在如今的技术水平上，大数据处理技术对于日常生活是非常重要的。此次实验目的是为了让我们更加熟悉Spark的RDD基本操作及键值对操作；熟悉使用RDD编程解决实际具体问题的方法。为此设定以下需求：1.pyspark交互式编程提供分析数据data.txt，该数据集包含了某大学计算机系的成绩，数据格式如下所示：Tom,DataBase,80Tom,Algorithm,50Tom,DataStructure,60Jim,DataBase,90Jim,Algorithm,60Jim,Dat

2021-06-10 10:22:19 1886

原创调用MapReduce对文件中各个单词出现次数进行统计

调用MapReduce对文件中各个单词出现次数进行统计实验配置：系统:Ubuntu Kylin | 环境：Hadoop | 软件：Eclipse要求1.将待分析的文件（不少于10000英文单词）上传到HDFS2.调用MapReduce对文件中各个单词出现的次数进行统计3.将统计结果下载本地。操作步骤：调用MapReduce执行WordCount对单词进行计数**一：• 1. 在Eclipse中创建项目• 2. 为项目添加需要用到的JAR包• 3. 编写Java应用程序• 4. 编译运行

2020-12-19 11:50:21 699 1

企业网的规划与实施设计作业

某企业有三栋建筑物，行政楼，技术研发楼，生产车间。人力资源部，财务部，市场部在行政楼；研发部，销售部，技术中心在技术研发楼拓扑加论文

2021-01-13

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

原创 2021-06-10

原创 调用MapReduce对文件中各个单词出现次数进行统计

企业网的规划与实施设计作业

空空如也

原创调用MapReduce对文件中各个单词出现次数进行统计