urllib.request模块

本文深入讲解了Python中urllib模块的四个子模块:request、error、parse和robotparser的使用方法,包括如何获取网页信息、处理URL和解析robots.txt文件。通过实例演示了urllib.request.urlopen函数的详细用法,如读取网页、获取状态码和处理响应。

urllib包
urllib提供了一系列用于操作URL的功能 他有四个模块:
urllib.request 主要用来打开或者读取url
urllib.error 在请求中产生的一些错误
urllib.parse 用于处理url
urllib.robotparser 用于解析robots.txt文件
模块导入
注意导入时不能只导入urllib,而要导入urllib包下的相应的模块

import rllib.request

urllib.request.urlopen学习
urllib.request.urlopen 用来获取网页信息,其原型为:

urllib.request.urlopen(url, data=None, [timeout, ]*, cafile=None, capath=None, cadefault=False, context=None)

函数返回值为文件对象,约定赋值给response变量
对象可使用方法:

  • response.geturl() 返回网址
  • response.info() 返回头文件
  • response.getcode() 返回状态码(200正常,404丢失)

反回的response对象类似于文件对象,因此可以用文件的方法读取

#读取二进制字符
print(response.read())
#转化成网页代码
print(response.read().decode('utf-8'))

urllib.request.urlopen的详细用法

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值