1. 伪分布式情况下,当每次启动hadoop发现提示无法访问本机的9000端口,也就是无法访问namenode。暂时解决方案,格式化namenode重启,找到datanode的目录删除version的txt文本,因为格式化namenode后,namenode与datanode的ClusterID不同,删除后重启动自动添加匹配。 推测产生此问题的原因:hadoop路径没有改,默认的路径是系统临时目录,经常被清洗。
2.在eclipse环境下,编译hadoop程序(cleanup)
3.FileInputFormat(job, new Path(args[0])); args[0]在命令行中传参。
4.运行时,不用先建好输出目录,打上名字自动建立。
956

被折叠的 条评论
为什么被折叠?



