
HDFS
wisgood
这个作者很懒,什么都没留下…
展开
-
提高Hadoop Balancer 迁移block速度的方法
如何提高Hadoop Balancer迁移block的速度?1)增加DataNode用于balancer的bandwidth。dfs.datanode.balance.bandwidthPerSec52428800这个值是DataXceiverServer上BlockBalanceThrottler控制的带宽大小。该单位是Byte,如果机器的网卡和交换机的带宽有限,可以原创 2015-08-22 10:45:27 · 5798 阅读 · 0 评论 -
Apache Hadoop2.0之HDFS均衡操作分析
1 HDFS均衡操作原理HDFS默认的块的副本存放策略是在发起请求的客户端存放一个副本,如果这个客户端在集群以外,那就选择一个不是太忙,存储不是太满的节点来存放,第二个副本放在与第一个副本相同的机架但是不同节点上,第三个放在与第二个和第一个副本不同的机架上,原则是尽量避免在相同的机架上放太多的副本。随着时间的推移,在各个DataNode节点上的数据块会分布的越来越不均衡。如果集群不转载 2015-03-03 16:01:17 · 2409 阅读 · 0 评论 -
HDFS snapshot操作实战
Hadoop从2.1.0版开始提供了HDFS SnapShot的功能。一个snapshot(快照)是一个全部文件系统、或者某个目录在某一时刻的镜像。快照在下面场景下是非常有用:防止用户的错误操作:管理员可以通过以滚动的方式周期性设置一个只读的快照,这样就可以在文件系统上有若干份只读快照。如果用户意外地删除了一个文件,就可以使用包含该文件的最新只读快照来进行回复。备份:管理员可以根据需求来备原创 2015-08-17 12:09:16 · 2927 阅读 · 0 评论 -
Hadoop 2.x中fsimage和edits合并实现
在《Hadoop 1.x中fsimage和edits合并实现》文章中,我们谈到了Hadoop 1.x上的fsimage和edits合并实现,里面也提到了Hadoop 2.x版本的fsimage和edits合并实现和Hadoop 1.x完全不一样,今天就来谈谈Hadoop 2.x中fsimage和edits合并的实现。 我们知道,在Hadoop 2.x中解决了NameNode的单点故障转载 2015-07-26 10:47:06 · 1904 阅读 · 0 评论 -
hadoop edits 文件损坏修复办法
前段时间公司hadoop集群宕机,发现是namenode 磁盘满了。。清理出部分空间后,重启集群时,重启失败。又发现集群Secondary namenode 服务也恰恰坏掉,导致所有的操作log持续写入edits.new 文件,等集群宕机的时候文件大小已经达到了丧心病狂的70G+..重启集群报错 加载edits文件失败。分析加载文件报错原因是磁盘不足导致最后写入的log只写入一半就宕机了。转载 2015-07-26 10:40:55 · 2125 阅读 · 0 评论 -
Hadoop运维-删除目录下过期的数据
hadoop运维-删除目录下过期数据原创 2015-07-21 19:08:44 · 3791 阅读 · 0 评论 -
hadoop 新增Namenode
hadoop 集群新增namenode原创 2015-07-21 19:05:02 · 2348 阅读 · 0 评论