
Hadoop
文章平均质量分 94
本专栏记录Hadoop生态基本知识,HDFS,MR...
Aimyon_36
这个作者很懒,什么都没留下…
展开
-
Yarn调度流程
目前,Hadoop作业调度器主要有三种:FIFO、容量(Capacity Scheduler)和公平(Fair Scheduler)。Apache Hadoop3.1.3默认的资源调度器是Capacity Scheduler。先进先出不能体现任务的优先级,一些需要立即执行的任务仍需要等待前边的任务执行完才能执行。FIFO调度器(First In First Out):单队列,根据提交作业的先后顺序,先来先服务。Capacity Scheduler是Yahoo开发的多用户调度器。容器调度器资源分配算法。原创 2024-07-08 22:16:52 · 1033 阅读 · 0 评论 -
HDFS读写流程详细过程
HDFS详细的读写流程,edit和fsimage文件的更新,WAL技术原创 2023-05-29 15:01:58 · 12439 阅读 · 11 评论 -
Hadoop高可用
(1)所谓 HA(High Availablity),即高可用(7*24 小时不中断服务)。(2)实现高可用最关键的策略是消除单点故障。HA 严格来说应该分成各个组件的 HA机制:HDFS 的 HA 和 YARN 的 HA。(3)NameNode 主要在以下两个方面影响 HDFS 集群➢ NameNode 机器发生意外,如宕机,集群将无法使用,直到管理员重启➢ NameNode 机器需要升级,包括软件、硬件升级,此时集群也将无法使用。原创 2023-04-08 11:09:49 · 427 阅读 · 0 评论