hadoop整理 --按照题目顺序-面试题目汇总_hadoop给出一个具体问题选择一个题目-优快云博客

本文链接：https://blog.youkuaiyun.com/weixin_44931681/article/details/104946050

1.https://www.cnblogs.com/sunddenly/p/3977011.html

1.hadoop面试题及答案

2. Hadoop、Hive、HBase的区别

YARN架构概述
　　Yarn是管理内存调度和cpu资源分配的。
　　*NodeManager(NM)：常驻进程，类似于团队里面的码农，主要作用如下：
　　　　1）管理单个节点的资源。(看禅道，完成自己每天的工作安排)
　　　　2）处理来自ResourceManager的命令。(完成技术经理分配的任务)
　　　　3）处理来自ApplicationMaster的命令。(完成项目组长分配的任务)
　　*ApplicationMaster(AM)：是ResourceManager临时启用的一个节点，不是常驻进程，类似于一个技术小组长：
　　　　1）负责数据的切分，任务的监控与容错。（管理组内同事工作）
　　　　2）为应用程序申请资源分配给内部任务。（向领导为小组申请资源：人力、时间什么的）
　　*ResourceManager(RM) ：常驻进程，一个集群只有一个，用来管理集群调度情况的，就像一个部门的技术经理一样，其作用如下：
　　　　1）处理客户端请求，进行资源分配与调度。(对接产品需求，分给手下的人)
　　　　2）监控nodeManager（管理团队成员每天的工作）
　　　　3）启动或监控applicationMaster（可能项目太小不想亲自动手，临时任命一个小组长）
　　*Container：非常驻进程，它是yarn中的资源抽象，他封装了某个节点上的多维度资源，入内存，CPU，磁盘网络等。Am就运行在这里面，Nm通过打开关闭Container开完成资源的调度。