HDFS介绍

原创于 2020-10-12 20:32:44 发布 · 2.2w 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#大数据 #hadoop #hdfs

部署运行你感兴趣的模型镜像

HDFS 基本介绍

目标：掌握什么是HDFS，HDFS的使用场景，组成部分。

HDFS 是 Hadoop Distribute File System 的简称，意为：Hadoop 分布式文件系统。是 Hadoop 核心组件之一，作为最底层的分布式存储服务而存在。

分布式文件系统解决的问题就是大数据存储。它们是横跨在多台计算机上的存储系统。分布式文件系统在大数据时代有着广泛的应用前景，它们为存储和处理超大规模数据提供所需的扩展能力。

在这里插入图片描述

HDFS使用Master和Slave结构对集群进行管理。一般一个 HDFS 集群只有一个 Namenode 和一定数目的Datanode 组成。Namenode 是 HDFS 集群主节点，Datanode 是 HDFS 集群从节点，两种角色各司其职，共同协调完成分布式的文件存储服务。

在这里插入图片描述

NameNode（Master）管理者            - 只负责管理，管理集群内各个节点。
SecondaryNameNode 辅助管理          – 只负责辅助NameNode管理工作。
DataNode(Slave) 工作者，是负责工作，周期向NameNode汇报，进行读写数据。