hadoop学习笔记1---Hadoop体系介绍

本文详细介绍了Hadoop集群中核心组件的功能与运作机制,包括Namenode、SecondaryNamenode、DataNode、JobTracker和TaskTracker等,为读者提供了一个全面理解Hadoop系统架构的基础。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1、Namenode

HDFS的守护进程

记录文件时如何分割成数据块的,以及这些数据块被存储到哪些节点上

对内存和I/O进行集中管理

是个单点,发生故障将使集群崩溃


2、Secondary Namenode

监控HDFS状态的辅助后台程序

每个集群都有一个

与NameNode进行通讯定期保存HDFS元数据快照

当NameNode故障可以作为备用NameNode使用


3、DataNode

每台从服务器都运行一个

负责把HDFS数据块读写到本地文件系统


4、JobTracker

用于处理作业(用户提交代码)的后台程序

决定有哪些文件参与处理,然后切割task并分配节点

监控task,重启失败的task(于不同的几点)

每个集群只有唯一一个JobTracker,位于Master节点


5、TaskTracker

位于slave节点上,与datanode结合(代码与数据一起的原则)

管理各自节点上的task(由jobtracker分配)

每个节点只有一个tasktracker,但一个tasktracker可以启动多个JVM,用于并行执行map或reduce任务

与jobtracker交互


1.6、Master和Slave

Master:Namenode、Secondary Namenode、jobtracker。浏览器(用于观看管理界面),其它Hadoop工具

Slave:Tasktracker、Datenode

Master不是唯一的

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值