JAVA 使用org.apache.http.impl.client太久可能报UnknownHostException和open too many files错误

最新推荐文章于 2022-09-25 10:07:12 发布

原创最新推荐文章于 2022-09-25 10:07:12 发布 · 1.2k 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#DNS #UnknownHostException #java

本文详细介绍了如何在Linux环境下解决无线循环爬取网页时遇到的UnknownHostException与open too many files错误。通过使用org.apache.http.impl.client.CloseableHttpClient类并确保在每次使用后关闭client，成功解决了这两个问题。

在最近的开发过程中，写了一个无线循环爬取某网页的内容程序。当程序跑了两天后，就回出现UnknownHostException错误，即使我把DNS绑定了也会出现无法解析的错误。最后我发现有时候会连带着报错 open too many files 错误。

百度以后发现，在linux下可以用lsof -p ID（进程）查询某个进程打开的文件数，进程号可以用ps aux |grep xxx获取，这时会发现大量的无法识别的类型为sock的文件。（进程默认的最大打开文件数为1024），最后我推测可能是对于HttpClient 定义的client 当请求对方响应失败，句柄消失后，并不会被当做垃圾回收，而是被持续当做一个打开的文件。当积累到最大打开数量时，client无法在做TCP请求，所以会出现UnknownHostException, 同时也报了 open too many files 的错误。

这时，我的处理是使用org.apache.http.impl.client.CloseableHttpClient类在每次使用完成后，关闭client，就同时解决了以上两个问题。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。