有的时候, datanode或者tasktracker crash,或者需要向集群中增加新的机器时又不能重启集群。下面方法也许对你有用。
1.把新机器的增加到conf/slaves文件中(datanode或者tasktracker crash则可跳过)
2.在新机器上进入hadoop安装目录
$bin/hadoop-daemon.sh start datanode
$bin/hadoop-daemon.sh start tasktracker
3.在namenode上
$bin/hadoop balancer
参照[url]http://www.cnblogs.com/rilley/archive/2012/02/13/2349858.html[/url]
1.把新机器的增加到conf/slaves文件中(datanode或者tasktracker crash则可跳过)
2.在新机器上进入hadoop安装目录
$bin/hadoop-daemon.sh start datanode
$bin/hadoop-daemon.sh start tasktracker
3.在namenode上
$bin/hadoop balancer
参照[url]http://www.cnblogs.com/rilley/archive/2012/02/13/2349858.html[/url]

本文介绍了一种在不重启集群的情况下向Hadoop集群中增加新节点的方法。具体步骤包括:更新conf/slaves文件以包含新节点;在新节点上启动datanode和服务;最后,在namenode上运行balancer来均衡数据分布。

被折叠的 条评论
为什么被折叠?



