启动spark-shell:
简单的RDD:
上述代码中使用的sc,这是Spark-Shell帮助我们自动生成的SparkContext的实例:
我们把生成的RDD的每个元素都乘以3:
上述的操作都是transformations我们需要触发一个action才能执行:
我们可以看到预期结果,但我们可以看到collect操作返回的是一个Array,所以数据不要太多,否则会出现OOM
下面执行下filter操作:
真的spark编程应该是完全函数式的,我们把上述操作用一行代码搞定:
本文介绍如何使用 Spark 的核心组件 RDD 进行数据处理,包括创建 RDD、执行转换操作如 map 和 filter,以及触发行动操作如 collect,并提供实际代码示例。
5402

被折叠的 条评论
为什么被折叠?



