马克-to-win@马克Java社区:RDD(Resilient Distributed Datasets)弹性分布式数据集。你不好理解的话,可以把RDD就可以看成是一个简单的"动态数组"(比如ArrayList),对其操作,也只需要 调用它的方法而已,和java中的ArrayList一样。但它与一般动态数组的区别在于:RDD是分布的。弹性是指的是数据自动在内存和磁盘切换, task如果失败会进行特定次数的重试。如果在某个节点发生错误,RDD会自动在不同的节点中重试。
更多请看下节:https://blog.youkuaiyun.com/qq_44596980/article/details/93308230
马克Java社区介绍了RDD(Resilient Distributed Datasets)弹性分布式数据集,可将其看成简单的“动态数组”,操作类似Java中的ArrayList。其与一般动态数组的区别在于具有分布性,且数据能自动在内存和磁盘切换,任务失败会重试。
328

被折叠的 条评论
为什么被折叠?



