
BigData
_筱羽
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
MapReduce优缺点
MapReduce是一个分布式运算程序的编程框架,是用户开发“基于Hadop的数据分析应用”的核心框架。MapReduce核心功能是将用户编写的业务逻辑代码和自带默认组件整合成一个完整的分布式运算程序,并发运行在一个 Hadoop集群上。MapReduce的优缺点:优点1.MapReduce易于编程它简单的实现一些接口,就可以完成一个分布式程序,这个分布式程序可以分布到大量...原创 2019-12-23 19:49:04 · 1032 阅读 · 0 评论 -
NameNode节点的增添或删减
NameNode的增添:直接关联到集群(前提是复制过来的hadoop框架里原来的HDFS系统存留文件已经删除,并且环境已配置好)[......]$ source /etc/profile[......]$ sbin/hadoop-daemon.sh start[......]$ sbin/yarn-daemon.sh start nodemanager删减节点:有两种方法...原创 2019-12-23 19:33:10 · 573 阅读 · 0 评论 -
NameNode是如何判断DataNode是否存可用
在这之前先了解一下DataNode的工作机制: DataNode在启动后会向NameNode注册,注册成功后,DataNode会每隔一小时向NameNode上报一次自己所在节点所有的块信息。之后会每隔3s有一次心跳(与NameNode通信),心跳返回结果会带回来NameNode给该DataNode的命令。NameNode如果超过一定时间没有收到DataNode的心跳,会判定此DataNo...原创 2019-12-23 19:12:38 · 1456 阅读 · 0 评论 -
NameNode上的fsimage和edits文件
思考:NameNode中的元数据是存储在哪里的?首先,我们做个假设,如果存储在NameNode节点的磁盘中,因为经常需要进行随机访问,还有响应客户请求,必然是效率过低。因此,元数据需要存放在内存中。但如果只存在内存中,一旦断电,元数据丢失,整个集群就无法工作了。因此产生在磁盘中备份元数据的FsImage。这样又会带来新的问题,当在内存中的元数据更新时,如果同时更新FsImage,就会导致效...原创 2019-12-23 18:47:21 · 1015 阅读 · 0 评论 -
HDFS的架构
HDFS是由NameNode、DataNode和SecondaryNameNode组成的。NameNode:它是一个管理者,管理着DHFS的命名空间、配置副本策略、数据块的映射信息还有就是处理客户端的读写请求(注意:他只负责处理读写的请求,而不会对数据进行读取的操作)。DataNode:这个组件就是用来对数据进行操作的。它负责接收NameNode下达的命令,然后执行实际的操作。...原创 2019-12-23 15:11:41 · 177 阅读 · 0 评论 -
HDFS概述
HDFS的产生背景:现在的数据增长速度非常快,随着数据量越来越大,一台计算机来存储数据就显得很吃力,那么就把数据存放在多台计算机上,但是这样非常的不便于对数据的管理和维护。所以迫切的需要一种系统来管理多台计算机上的数据。这就是分布式 文件管理系统。这里所介绍的HDFS就是其中一种。HDFS是什么?看完第一段话想必大家都已经知道了,HDFS就是一个分布式的文件系统。这个文件系统,用来存储...原创 2019-12-23 14:56:45 · 146 阅读 · 0 评论