【综述1】大数据框架实例(Hadoop 原理总结)

大数据框架实例(Hadoop 原理总结)

  • 简介

Hadoop是一个开发和运行处理大规模数据的软件平台,实现了在大量的廉

价计算机组成的集群中对海量数据进行分布式计算。

    大概工作流程如下图:

 

Hadoop框架中最核心的设计是HDFS(文件系统)和MapReduce(编程模型,大数据并行运算)

二、HDFS(文件系统)

1、HDFS简介

HDFS即Hadoop Distributed File System:分布式文件存储系统,为海量的数据提供了存储,HDFS:其实就是个文件系统,和fastDFS类似,像百度云阿里云等就是个文件存储系统,当然一般如果仅仅是为了用来存储文件的话直接fastDFS这个就已经够了,HDFS目的不单单是用来存储文件这么简单,它还涉及分布式计算等。

2、HDFS结构

HDFS 由一个管理结点 ( NameNode )和N个数据结点 ( DataNode )组成,

NameNode

NameNode:是Master节点,是大领导。管理数据块映射;处理客户端的读写请求;配置副本策略;管理HDFS的名称空间。

NameNode基于内存存储,存储的是一些文件的详细信息,比如文件名、文件大小、创建时间、文件位置等。NameNode 也是整个 HDFS 的核心,它通过维护一些数据结构,记录了每一个文件被切割成了多少个 Block,这些 Block 可以从哪些 DataNode 中获得,各个 DataNode 的状态等重要信息。

 

 

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值