如何搭建hadoop

Windows下Hadoop安装与调试

 

首先,参考windows上搭建hadoop教程,注意cygwin相关包的下载,另外环境变量的设置等等;

到了最后一步,会出错,是namenode没有format。

如果出现jar的错误,往往是命令行路径的问题;

 

可以bin/hadoop fs -ls
但是不能put文件上去


如果出现“could only be replicated to 0 nodes, instead of 1 ,hadoop, ”,往往是hdfs上的文件名有冲突所以无法上传;

清理对应目录的数据以后,就可以正常运行了

把safemode置于off状态:hadoop dfsadmin -safemode leave;然后再重启cygwin;

 

$ bin/hadoop dfs -put ./input input

执行成功,但是jps还是只显示3个任务;

$ bin/hadoop jar hadoop-*-examples.jar grep input output 'dfs[a-z.]+'

还是报错;

 

Hadoop搭建主要涉及以下步骤: 1. **前期准备**:确定集群规模和硬件资源,选择合适的操作系统和Hadoop版本,进行网络配置,确保集群内各节点之间可以互相通信。同时,设置各节点的环境变量,安装和配置Java环境以及其他必要的软件和工具[^1]。 2. **配置核心组件和节点角色**:配置Hadoop的核心组件(如HDFS和YARN)和各节点角色(如NameNode、DataNode、ResourceManager、NodeManager等)。具体配置文件修改如下: - **core - site.xml**:可使用命令 `[root@hadoop102 ~]$ cd $HADOOP_HOME/etc/hadoop` 进入相关目录,再使用 `[root@hadoop102 hadoop]$ vim core - site.xml` 进行编辑修改[^2]。 - **hdfs - site.xml**:使用命令 `sudo gedit /usr/local/hadoop/etc/hadoop/hdfs - site.xml` 编辑,示例配置如下: ```xml <property> <name>dfs.replication</name> <value>3</value> </property> <property> <name>dfs.datanode.data.dir</name> <value>file:/usr/local/hadoop/hadoop_data/hdfs/datanode</value> </property> <property> <name>dfs.namenode.name.dir</name> <value>file:/usr/local/hadoop/hadoop_data/hdfs/namenode</value> </property> ``` - **mapred - site.xml**:YARN主要负责分布式集群的资源管理,通过对 `mapred - site.xml` 配置文件的修改,将Hadoop MapReduce分布式并行计算框架在运行中所需要的内存、CPU等资源交给YARN来协调和分配[^4]。 - **yarn - env.sh**:可进行如下配置: ```bash export JAVA_HOME=/usr/java/jdk export YARN_LOG_DIR=/usr/hadoop/hadoop - 2.7.4/logs/yarn ``` 完成上述配置后,即可完成集群的部署[^5]。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值