urllib是Python标准库的一部分,包含urllib.request,urllib.error,urllib.parse,urllib.robotparser四个子模块,这里主要介绍urllib.request的一些简单用法.
首先是urlopen函数,用于打开一个URL:
urlopen返回一个类文件对象,可以像文件一样操作,同时支持一下三个方法:
- info():返回一个对象,表示远程服务器返回的头信息。
- getcode():返回Http状态码,如果是http请求,200表示请求成功完成;404表示网址未找到。
- geturl():返回请求的url地址。
有时候我们需要设置代理,这时我们可以这样做:
如果要细致的设置代理,可以用opener的open方法打开URL:
打开url后,我们可以将内容写入一个本地文件来达到保存网页的目的,但是这里有一个更方便的方法,那就是调用urlretrieve():
文章转载自:http://blog.youkuaiyun.com/lincifer/article/details/27374313
如有侵权,敬请告知!!!!!