hadoop包括如下几个模块:
- hadoop common:公用的工具,支持其他的hadoop模块
- hadoop distribute file system(hdfs):分布式文件系统,提供了一个高吞吐量
- hadoop yarn:作业调度和集群资源管理的框架,比如集群中还有多少资源(内存、cpu)可以用。例如作业提交上去时,需要10G内存,但是当前只有5G的容量,这时这个作业就无法提交。
- hadoop mapreduce:基于yarn的并行处理大数据的系统
本文详细介绍了Hadoop的四个核心模块:HadoopCommon、HadoopDistributedFileSystem(HDFS)、HadoopYARN和HadoopMapReduce。HadoopCommon提供了支持其他模块的通用工具;HDFS作为分布式文件系统,确保了高吞吐量的数据访问;HadoopYARN负责作业调度和集群资源管理,如内存和CPU的分配;而HadoopMapReduce则基于YARN实现了并行处理大数据的能力。
hadoop包括如下几个模块:
2371
2856
16万+
2386

被折叠的 条评论
为什么被折叠?