hadoop完全分布式过程中遇到的一些问题和总结

最新推荐文章于 2024-05-14 20:16:07 发布

WitsMakeMen

最新推荐文章于 2024-05-14 20:16:07 发布

阅读量2.8k

点赞数

CC 4.0 BY-SA版权

文章标签： hadoop exception mapreduce thread ssh 任务

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/WitsMakeMen/article/details/7717693

本文分享了在配置Hadoop完全分布式系统过程中遇到的问题及解决办法，包括端口冲突、SSH无密码登录配置等，并介绍了《Hadoop权威指南》中的关键知识点。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

最近接触在配置nutch，接触到一些hadoop方面的知识，自己想配置一个完全分布式的hadoop系统，配置过程中遇到了很多的问题，这里将自己遇到的问题进行总结一下。

（1）首先是Exception in thread "main" java.io.IOException: Call to /XXX.XXX.XX.XXX:9000 failed on local exception: java.io.EOFException。该问题是由于9000端口被使用造成的，因为全面配置nutch的时候占用的9000端口，所以运行程序的时候出现了这个问题。可以将配置文件core-sites.xml文件的fs.default.name端口改为其他值。

（2）系统在配置过程中遇到不能登录本地机器的情况，本以为本机登录本机不需要设置，但是这是错误的想法，要想本机无密码登录本地机器，也需要对本地机器进行无密码ssh设置。

下面介绍一下昨天看hadoop权威指南的一下收获：

（1）首先reduce输出路径在任务运行前应该不存在，这样设计的目的是为了防止结果被覆盖。

（2）map和reduce输出类型相同，都有setoutputkeyclass和setOutputValueClass指定。

（3）关于配置文件，core-site.xml配置文件负责配置Common组建属性，hdfs-site.xml配置问津啊负责配置hdfs属性，mapred-site.xml配置文件负责MapReduce属性配置。

（4）配置ssh要确保用户能够无密码登录本地机器。

（5）HDFS的意思是分布式文件系统。

（6）hadoop是基于数据流的程序驱动运行过程。

（7）hadoop分布式运行的关键是如何正确配置属性和正确运行守护程序。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

WitsMakeMen 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。