Spark数据集RDD的特性,Spark不适用于异步细粒度更新状态的应用,例如Web服务的存储或者增量的Web爬虫和索引。即对于增量修改的应用模型,Spark并不适用。
Spark和Hadoop
最新推荐文章于 2025-04-28 22:47:27 发布
博客指出Spark的Resilient Distributed Datasets (RDD)特性不适用于需要频繁异步细粒度更新状态的应用,如Web服务存储或增量Web爬虫与索引。Spark设计上不支持这类对数据进行增量修改的模型。
1108

被折叠的 条评论
为什么被折叠?



