Hadoop [2] -- Hadoop 分布式文件系统剖析

I.Intro

  • 什么是 DFS?
  • 什么是 HDFS?
  • 如何应用 HDFS?

II.Get Started

1.什么是 DFS?

  • 由于一台机器的存储容量有限,当我们需要处理的数据量达到一定级别时,单个机器是很难满足我们的需求的。倘若让一台机器一下子在内存处理一个几十G, 甚至上百G的文件检索任务,显然是不可能完成的,即使有这样高效配置豪华的电脑,效率也是极低的。所以我们需要将文件存放在多台机器上,这就是分布式文件系统(DFS – Distributed File System)。
  • DFS 核心架构是 Master-Slave Model。这是一个分布式模型。整个DFS 有一个多节点计算机集群组成。这些节点分两类:一类是“主节点” (Master Node), 也被称为“名称节点”(Name Node);另一类叫“从节点”(Slave Node),也被称为“数据节点”(Data node)。

2.什么是 HDFS?

  • 基于DFS 架构,并在Hadoop 平台实现的分布式文件系统。(Java实现)

3.Name Node & Data Node

  • Name Node 负责管理文件系统的命名空间及客户端对文件的访问,也就是中心服务器,HDFS 只包含一个名称节点。
  • Data Node 其实就相当于本地的一台Linux 服务器,在Name Node 的统一调度下,负责处理文件系统客户端的读写请求,或对数据的增删改查。HDFS 中一般有多个数据节点。

III. Summary

 学而时习之,方可为师也!?

  • DFS 是分布式文件系统

 Do what you want to do, be what you want to be!
 LOVE && PEACE. ?

Happy Coding.

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值