Hadoop的初步理解

本文详细介绍了Hadoop分布式文件系统(HDFS)的组成与工作原理,包括NameNode、DataNode和Block的概念。同时,阐述了MapReduce计算框架的基本原理,如何实现数据的分布式存储与高效计算。

一、整体思维导图

Hadoop

二、HDFS(Hadoop分布式文件系统)

MapReduce

说明

  1. NameNode:保存整个文件系统的目录信息、文件信息及分块信息,这是由唯一一台主机专门保存,当然这台主机如果出错,NameNode就失效了。在Hadoop2.*开始支持activity-standy模式----如果主NameNode失效,启动备用主机运行NameNode。
  2. DataNode:分布在廉价的计算机上,用于存储Block块文件。
  3. Block:将一个文件进行分块,通常是64M。

三、MapReduce

HDFS

说明

首先数字是分布存储在不同块中的,以某几个块为一个Map,计算出Map中最大的值,然后将每个Map中的最大值做Reduce操作,Reduce再取最大值给用户。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值