网页下载器有两种:
1 urllib2 —Python官网基础模块
2 requests —第三方包更强大
urllib2
最简洁的方法
urllib2.urlopen(url)
urllib2下载网页方法2 :添加data,http header
urllib2方法3 :添加特殊情景的处理器
HTTPCookieProcessor :有些网站需要登录才可以使用,我们就用这个.
ProxyHandle:有些网页需要代理才可用使用,我们用这个.
HTTPSHandler:有些网页是使用HTTPS加密访问的,我们使用这个
HTTPRedirectHandler:有些网页URL自动跳转的关系,我们使用这个.
举个coockie的栗子