python爬虫入门之urllib的简单使用

刘东义的博客

于 2019-03-05 17:23:26 发布

阅读量228

点赞数

文章标签：最常用的urllib模块

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/qq_40210617/article/details/88188506

版权

urllib库的应用：

import urllib.request

① urlretrieve()这个模块属于直接下载网页到指定路径

用法：urlretrieve（网址，本地文件存储地址）

例子：

urllib.request.urlretrieve("http://www.baidu.com","D://python3文件//baidu.html")

在编辑器上可以打以下代码则直接下载（在指定的路径下能找到你所下载的网页）

from urllib import request
a = request.urlretrieve("http://www.baidu.com","D://python3文件//baidu.html")

② info()属于查看网页的相关信息

例子：

from urllib import request
b=request.urlopen("https://read.douban.com/provider/all")
print(b.info())

我们查看到的是豆瓣网址中的一些信息如下

③getcode() ：得到访问状态码，200为正常状态码，非200为非正常状态码

from urllib import request
b=request.urlopen("https://read.douban.com/provider/all")
print(b.getcode())

④geturl()：获得现在所访问的url地址

from urllib import request
b=request.urlopen("https://read.douban.com/provider/all")
print(b.geturl())

⑤urlcleanup() 清除缓存信息，没有报错执行说明已经清除

直接执行就行

刘东义的博客

博客等级

码龄8年

61
原创

59
点赞

344
收藏

66
粉丝

关注

私信

热门文章

分类专栏

展开全部收起

最新评论

vmware关于虚拟网卡VMnet8路由总结
a422416061: 另外说一下哈，vmnet8的网关其实设置了不生效，因为一台多网卡主机上，只能有一个默认网关，所以是不会把数据包发到虚拟路由器的接口上。看了一下vmware的设置，虚拟路由器就是vmware设置了的一个代理服务器，分别提供、dns、dhcp、vm机器的网关服务
vmware关于虚拟网卡VMnet8路由总结
a422416061: 主机ping不通vmnet的网关是因为没有到虚拟路由器的路由，走tracert会发现数据包是往外网发送的。这就是明显的证据。vm机能联网是因为使用了nat-p，利用主机的ip进行路由出去，端口号是vmware的应用端口，当主机收到这个端口号的数据会发给vmware软件（虚拟路由器）然后进行数据分发，分发到vm机器上。这部分不涉及vmware底层，只涉及应用网络通讯。若有不对，请指出，一起探讨
HCIE进阶之路------OSPF 2-way状态DR,BDR非正常选举
江南啊小司: 这是面试题资料？

大家在看

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。