-
spark是基于
内存计算
,会将中间结过存放在内存,方便后续计算的使用。MR会将中间结果存储在磁盘上。-
内存数据的读写速度要比磁盘快的多,所以spark的计算速度要比MR快
-
Presto也是基于内存计算的,Presto不适合海量数据处理,而且不能创建库表。Spark对海量数据在内存上的计算做了优化,内存不足是会将结果存在磁盘上,适合海量数据处理,并且可以进行库表创建
-
-
Spark的
计算任务是由线程
完成的。MR的计算任务是由进程完成的-
线程切换计算任务的速度比进程切换计算任务速度快
-
Spark和MapReduce的区别
于 2023-02-17 09:18:42 首次发布