在刚开始学习Spark 的时候总能遇到在理解RDD的时候概念不清晰的地方,
官方解释:
Resililent Distributed Datasets
弹性分布式数据库
可能大家也没有理解这个到底是一个什么样的东西。
说说我的简单理解:
Spark 实现了一种分布式内存抽象,成为弹性分布式数据集(RDD)
在刚开始学习Spark 的时候总能遇到在理解RDD的时候概念不清晰的地方,
官方解释:
Resililent Distributed Datasets
弹性分布式数据库
可能大家也没有理解这个到底是一个什么样的东西。
说说我的简单理解:
Spark 实现了一种分布式内存抽象,成为弹性分布式数据集(RDD)