当python爬虫遇到10060错误

原创

于 2017-03-15 10:17:42 发布 · 3.4k 阅读

8 ·

CC 4.0 BY-SA版权

文章标签：

#Python #爬虫 #url

在进行Python爬虫工作时，遇到10060错误通常是由于网络访问策略限制。通过设置ProxyHandler代理可以解决大部分问题，但当尝试下载图片时，即使设置代理仍可能报错。通过直接调用urllib2.urlopen获取图片URL的响应，读取二进制数据并保存，最终成功下载图片。本文分享了解决此类问题的方法。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

相信做过网站爬虫工作的同学都知道，python的urllib2用起来很方便，使用以下几行代码就可以轻松拿到某个网站的源码：

#coding=utf-8
import urllib
import urllib2
import re

url = "http://wetest.qq.com"
request = urllib2.Request(url)
page = urllib2.urlopen(url)
html = page.read()
print html

最后通过一定的正则匹配，解析返回的响应内容即可拿到你想要的东东。

但这样的方式在办公网和开发网下，处理部分外网站点时则会行不通。

比如：http://tieba.baidu.com/p/2460150866，执行时一直报10060的错误码，提示连接失败。