- 博客(3)
- 收藏
- 关注
原创 spark内核源码学习-RDD基础篇
spark内核源码学习-RDD基础篇1. RDD基本概念RDD,英文全称:resilient distributed dataset,中文名:弹性分布式数据集。它是可以并行处理的,错误容忍性强的数据集合。RDD是只读的,不能修改里面的数据,当对RDD使用map等转换操作后,会生成新的RDD。在spark中,我们可以通过SparkContext的parallelize方法,把一个普通集合创建为一个RD
2017-03-17 09:31:33
984
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人