文章目录
零、本讲学习目标
- 掌握转化算子的使用
- 掌握行动算子的使用
一、RDD算子
- RDD被创建后是只读的,不允许修改。Spark提供了丰富的用于操作RDD的方法,这些方法被称为算子。一个创建完成的RDD只支持两种算子:
转化(Transformation)
算子和行动(Action)
算子。
二、准备工作
(一)准备文件
1、准备本地系统文件
- 在
/home
目录里创建words.txt
2、把文件上传到HDFS
- 将
words.txt
上传到HDFS系统的/park
转化(Transformation)
算子和行动(Action)
算子。/home
目录里创建words.txt
words.txt
上传到HDFS系统的/park