urlparse 模块

本文详细介绍了Python中urlparse模块的使用方法,包括urlparse(), urlunparse()和urljoin()三个核心函数,展示了如何解析、组合及拼接URL,是进行网络爬虫或Web开发时处理URL的必备知识。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

urlparse 模块

urlpasrse 模块提供了一些基本功能,用于处理 URL 字符串。这些功能包括 urlparse()、urlunparse()和 urljoin()

 from urllib import parse as urlparse(3.0版本后)

urlparse()将 urlstr 解析成一个 6 元组(prot_sch, net_loc, path, params, query, frag)。

eg:url_my=urlparse.urlparse('http://www.python.org/doc/FAQ.html')    #解析URL
	print (url_my)
	结果为:ParseResult(scheme='http', netloc='www.python.org', path='/doc/FAQ.html', params='', query='', fragment='')

urlunparse()的功能与 urlpase()完全相反

eg:url_un=urlparse.urlunparse(url_my)#组合URL
    print("url_un为",url_un)
    结果为:url_un为 http://www.python.org/doc/FAQ.html

urljoin()要处理多个相关的 URL
urljoin()取得根域名,并将其根路径(net_loc 及其前面的完整路径,但是不包括末端的
文件)与 newurl 连接起来。

eg:ur=urlparse.urljoin('http://www.python.org/doc/FAQ.html','current/lib/lib.htm')#拼接URL
	print(ur)
	结果为:http://www.python.org/doc/current/lib/lib.htm

总结为如下表格:

urlparse函数描述
urlparse(urlstr, defProtSch=None, allowFrag=None)将 urlstr 解析成各个组件,如果在 urlstr 中没有给定协议或者方案,则使用 defProtSch;allowFrag 决定是否允许有 URL 片段
urlunparse(urltup)将 URL 数据(urltup)的一个元组拼成一个 URL 字符串
urljoin(baseurl, newurl, allowFrag=None)将 URL 的根域名和 newurl 拼合成一个完整的 URL;allowFrag 的作用和urlpase()相同
https://mp.youkuaiyun.com/mdeditor#

链接: link.

Alt感谢大家的阅读!

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值