- 博客(2)
- 资源 (1)
- 收藏
- 关注
原创 RDD编程初级实践(基于python)
RDD编程初级实践(基于python)1.需求描述1.1pyspark交互式编程1.2编写独立应用程序实现数据去重1.3编写独立应用程序实现求平均值问题2.环境介绍3.实验及数据来源分析3.1pyspark交互式编程3.2编写独立应用程序实现数据去重3.3编写独立应用程序实现求平均值问题4.实验步骤4.1pyspark交互式编程4.2编写独立应用程序实现数据去重4.3编写独立应用程序实现求平均值问题1.需求描述(1)熟悉Spark的RDD基本操作及键值对操作;(2)熟悉使用RDD编程解决实际具体问题的
2021-06-07 09:24:51
746
原创 调用MapReduce对文件中各个单词出现次数进行统计
调用MapReduce对文件中各个单词出现次数进行统计调用MapReduce对文件中各个单词出现次数进行统计一、安装环境二、需求分析1.创建hadoop账户2.设置Hadoop密码3.为Hadoop用户增加管理员权限4.更新apt5.安装vim6.安装SSH、配置SSH无密码登陆三、安装java环境1.安装JDK2.验证JDK安装情况3.安装 Hadoop3.1.3四、安装hadoop五、Hadoop单机配置(非分布式)六、Hadoop伪分布式配置1.修改配置文件2.格式化 NameNode3.开启Name
2020-12-06 23:04:00
1336
RDD编程初级实践Tom,DataBase,80 Tom,Algorithm,50 Tom,DataStructure,60 Jim,DataBas
2021-06-09
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人