1.python标准库urllib的使用[入门]

本文深入介绍了Python标准库urllib,包括urllib.request模块的函数和类,如urlopen()和OpenerDirector,用于打开和读取URL。同时,阐述了urllib.parse模块的功能,用于解析URL。通过示例展示了如何设置请求头、处理中文参数和使用代理。参考了官方文档及相关教程,是学习urllib库的好资料。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

该篇文章, 主要介绍了几个urllib中常用的类函数。

1.urllib——处理URL

urllib 是一个收集了多个用到 URL 的模块的包, 是python标准库的一员


1.1. urllib.request 模块——打开读取URL

urllib.request 模块定义了适用于在各种复杂情况下打开 URL(主要为 HTTP)的函数 — 例如基本认证、摘要认证、重定向、cookies 及其它。

1.1.1函数

  • urllib.request.urlopen(url,...) , 打开url指定的资源, url可以是字符串也可以是urllib.request.Request对象, 返回一个http.client.response对象

  • urllib.request.``build_opener([handler, ...])

    返回一个OpenerDirector实体


1.1.2.类

  • class urllib.request.Request(url, data=None, headers={}, origin_req_host=None, unverifiable=False, method=None)

    这个类是一个对URL 请求的抽象

    • 其中url参数, 是字符串类型, 是对应资源的url。
    • header参数, 是一个字典类型的请求消息头。
  • class urllib.request.OpenerDirector

    该类通过连接在一起的BaseHandlers打开url。它管理handlers链和从错误中恢复。

    OpenerDirector实例的open(url, data=None[, timeout]) 方法, 打开一个url。它的返回值和引起的异常和urllib.request.urlopen()一样。

  • class urllib.request.ProxyHandler(proxies=None)

    通过代理发出请求, 如果proxies参数被给与, 它必须是一个字典(从协议到IP映射的字典)


1.2. urllib.parse ——解析URL

  • urllib.parse.urlencode(query,...)

    mapping object或包含str或bytes对象的二元组的序列转换为百分比编码的ASCII文本字符串。


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值