最近做一个spider,尝试着非阻塞式的最大利用网卡,顺便继续探索下gevent,遇到一个比较杯具的问题,链接统统都超时了。
由于正常访问及老的spider没有问题,可以得出服务器肯定没有挂。纠结了好一阵。
这个url是绑的hosts,会否是这个造成滴捏?
宾果!
因为走了hosts,而新spider用了monkey.patch_all(),
其中dns patch走了DNS,所以。。。,置成false即可~
由于正常访问及老的spider没有问题,可以得出服务器肯定没有挂。纠结了好一阵。
这个url是绑的hosts,会否是这个造成滴捏?
宾果!
因为走了hosts,而新spider用了monkey.patch_all(),
其中dns patch走了DNS,所以。。。,置成false即可~
本文探讨了一个使用gevent进行非阻塞式爬虫开发过程中遇到的问题:通过hosts文件绑定URL时出现链接超时现象的原因及解决方案。作者发现启用monkey.patch_all()导致DNS解析路径改变,最终通过调整配置解决了问题。
3881

被折叠的 条评论
为什么被折叠?



