Hadoop学习笔记-5

最新推荐文章于 2025-07-15 18:11:29 发布

原创最新推荐文章于 2025-07-15 18:11:29 发布 · 157 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#hadoop

大数据专栏收录该内容

16 篇文章

订阅专栏

本文详细介绍了如何在Hadoop集群中独立启动和停止进程，新增DataNode主机的步骤，以及通过API进行配置参数修改的方法。同时，还探讨了Hadoop与软/硬连接的不兼容性。

1. 独立启动/停止Hadoop进程

在一台主机上执行

hadoop-daemon.sh start datanode
hadoop-daemon.sh stop datanode
或者
hdfs datanode
Ctrl + z
bg 或者 bg %1 # 转后台运行

2. 新增DataNode主机

# 清除存在的tmp和logs目录

# 启动datanode进程
hadoop-daemon.sh start datanode

# 启动yarn进程
yarn-daemon.sh start nodemanager

# 在NameNode节点上刷新节点
hdfs dfsadmin -refreshNodes

# 查看Web UI
node01:50070
node01:8088

# 做均衡处理将数据分担到新增节点上
hdfs balancer

# 上传文件到HDFS
hdfs dfs -put abigfile /data