Hadoop架构——云计算的具体实现

本文深入介绍了Hadoop的核心技术,包括其发展历程、如何解决海量数据存储与分析的问题,并详细解析了HDFS架构及其高可用策略。
Hadoop是IT行业一个新的热点,是云计算的一个具体实现、Hadoop本身具有很高的技术含量,是IT工程师学习的首选!下面我们来详细讲讲什么是Hadoop。 

完整hadoop讲解视频教程下载地址: 

1、http://kuai.xunlei.com/d/CLCBYHQKJQNT 

2、http://kuai.xunlei.com/d/CSMFERCHAGEE 

Hadoop是什么: 

Hadoop = The Hadoop projects 

Common, Avro, MapReduce, HDFS, Pig, Hive, Hbase, ZooKeeper, Sqoop, Oozie 

Hadoop要解决的两个问题: 

1、海量数据的存储 -- HDFS 

2、海量数据的分析 -- MapReduce 

Hadoop发展的历史: 

始于2002年的apache项目Nutch 

2003年Google发表了关于GFS的论文 

2004年Nutch的开发者开发了NDFS 

2004年Google发表了关于MapReduce的论文 

2005年MapR被引入了NDFS 

2006年改名为Hadoop,NDFS的创始人加入Yahoo,Yahoo成立了一个专门的小组发展Hadoop 

HDFS设计目标: 

1、Very large files 

2、Streaming data access 

write-once, read-many-times 

3、Commodity hardware 

HDFS架构: 

在Hadoop中,一个文件被划分成大小固定的多个文件块,分布的存储在集群中的节点中 


Block:一个文件分块,默认64M 

NameNode:保存整个文件系统的目录信息,文件信息以及文件相应的分块信息。 

DataNode:用于存储Blocks 

HDFS的HA策略:NameNode一旦宕机,整个文件系统将无法工作。 

如果NameNode中的数据丢失,整个文件系统也就丢失了。 

2.x开始,HDFS支持NameNode的active-standy模式。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值