002_看大纲_hadoop大纲

本文介绍了Hadoop的两大核心组件HDFS和MapReduce的工作原理。HDFS负责分布式存储,通过NameNode管理和DataNode保存数据实现;MapReduce则用于分布式计算,通过JobTracker调度和TaskTracker执行任务完成并行计算。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

002_看大纲_hadoop大纲

通过前面一节可以了解一个大概,知道云计算的含义和hadoop的生态体系

知识链接:001_扎马步_初识hadoop 

Hadoop有两大部分:HDFS+MapReduce

其中HDFS实现分布式存储的底层支持,Mapreduce来实现分布式并行计算。

HDFS采用主从结构模型。一个master,若干个slave。对应到集群中由一个NameNode和若干个DataNode组成。其中NameNode作为主服务器管理文件系统的命名空间和客户端对文件的访问。DateNode负责保存数据。为了增加HDFS的安全性,Hadoop采用了备份的方式,默认将同一个文件会保存3份。后面在介绍HDFS时会说明。

MapReduce是一种并行编程模式。可以同时在上千台计算机中运行。MapReduce框架是由一个单独运行在主节点的JobTracker和运行在每个集群从节点的TaskTracker共同组成。主节点负责调度构成一个作业的所有任务。TaskTracker负责执行任务。(一个JobTracker对应N个TaskTracker)

master--NameNode--JobTracker

slave--DataNode--TaskTracker

是不是对应起来很完美

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值