版本
hadoop2.6.5 java1.8
1。需要先创建输入目录以及输出目录,由于hadoop1.X版本与2.x不同,
下面是2.x的命令
./bin/hdfs namenode -format进行格式化namenode,最后通过./sbin/start-dfs.sh
创建HDFS目录
bin/hdfs dfs -mkdir -p /input
将数据放入到HDFS目录
bin/hdfs dfs -put /root/data /input
查看文件是否以及放入
hadoop fs -ls input
提交程序到hadoop
hadoop jar WordCount.jar WordCount input output
其中遇到的坑。
8088端口无法访问,一开始没有理会,之后提交程序,一直处于无法连接,
报错信息如下Already tried 9 time(s); retry policy is RetryUpToMaximumCountWithFixedSleep
这个时候需要检查yarn-site.xml的配置
<property>
<description>The http address of the RM web application.</description>
<name>yarn.resourcemanager.webapp.address</name>
<value>${yarn.resourcemanager.hostname}:8088</value>
</property>
1、HDFS页面:50070
2、YARN的管理界面:8088
3、HistoryServer的管理界面:19888
4、Zookeeper的服务端口号:2181
5、Mysql的服务端口号:3306
6、Hive.server1=10000
7、Kafka的服务端口号:9092
8、azkaban界面:8443
9、Hbase界面:16010,60010
10、Spark的界面:8080
11、Spark的URL:7077