Hadoop、Spark运行原理

最新推荐文章于 2020-08-21 23:31:06 发布

转载最新推荐文章于 2020-08-21 23:31:06 发布 · 555 阅读

文章标签：

#Hadoop #spark

分布式计算专栏收录该内容

0 篇文章

订阅专栏

博客介绍了Hadoop和Spark的运行原理并进行对比。Hadoop由HDFS、MapReduce和YARN组成；Spark主要由sparkcontext、cluster manager和executor构成，其中cluster manager负责集群资源管理，executor是应用执行主要进程。还给出了相关参考链接。

Hadoop、Spark运行原理

hadoop 运行原理
Spark运行原理
对比

hadoop 运行原理

Hadoop的主要组成模块包括以下三个部分：

Hadoop Distributed File System（HDFS）：分布式文件存储系统。
MapReduce：并行计算框架（可以自定义计算逻辑的部分）
Yet Another Resource Negotiator（YARN）：另一种资源协调者
https://blog.youkuaiyun.com/sky_flying1/article/details/78014723