利用Python库urllib.parse对URL路径进行解析、拆分

原创已于 2023-05-24 19:19:43 修改 · 1.4k 阅读

1 ·

CC 4.0 BY-SA版权

文章标签：

#URL解析

于 2023-03-30 10:48:44 首次发布

Web开发专栏收录该内容

49 篇文章

订阅专栏

博客介绍了利用Python库urllib.parse对URL路径进行解析、拆分的方法。通过示例代码展示了成员函数urlparse()对URL路径字符串的解析过程，它能将URL路径分析拆解，智能区分hostname、path和query等部分。

利用Python库urllib.parse可以很方便地帮助我们对URL路径进行解析、拆分。

示例代码如下：

# -*- coding: utf-8 -*-

import urllib.parse as urlparse

path = 'http://example.com/search?q=python+programming&num=10'

url = urlparse.urlparse(path)

运行结果如下：
在这里插入图片描述
从上面的运行结果我们可以看出：
成员池数urlparse()会对URL路径字符串“urlparse”进行解析，得到了一ParseResult 对象，这个对象把URL路径进行了分析和拆解。

如果我们把 path 换成是：

'/search?q=python+programming&num=10'

我们可以看一下又是怎么样的效果。
代码如下：

# -*- coding: utf-8 -*-

import urllib.parse as urlparse

path = '/search?q=python+programming&num=10'

url = urlparse.urlparse(path)

运行结果如下：
在这里插入图片描述
可见成员函数urlparse()还是挺智能的，它能知道哪些是属于hostname，哪些是属于path，哪些是属于query。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

昊虹AI笔记

关注关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
打赏
打赏
打赏举报

举报

专栏目录

「Python系列」Python urllib库（操作网页URL对网页的内容进行抓取处理）

日常笔记/总结/系列知识梳理

02-28

1536

urllib支持常见的网络协议，如 HTTP、HTTPS、FTP 等，并允许你定制请求头、处理重定向、使用代理等。然而，对于更复杂的用例，如使用 OAuth 进行身份验证、发送 JSON 数据、处理 cookies 等，你可能需要查看更高级的库，如。是 Python 标准库中的一个模块，它提供了用于解析 URL 的各种功能。你可以根据异常的类型执行不同的操作，如记录错误、重试请求或向用户显示友好的错误消息。来打开或读取 URL 时，可能会遇到各种错误，例如网络问题、无效的 URL 或服务器错误。

python实现对一个完整url进行分割的方法

01-20

本文实例讲述了python实现对一个完整url进行分割的方法。分享给大家供大家参考。具体分析如下： python对一个完整的url进行分割，将url分割成单独的部分，包括协议、域名、端口、路径、参数等等 import urlparse print urlparse.urlsplit('//www.jb51.net:80/faq.cgi?src=fie') 结果如下：复制代码代码如下:SplitResult(scheme=’http’, netloc=’www.jb51.net:80′, path=’/faq.cgi’, query=’src=fie’, fragment=”) 希望本文所

参与评论您还未登录，请先登录后发表或查看评论

python-分割url字符串

09-10

598

url = ' http://images.jupiterimages.com/common/detail/27/68/22986827.jpg' url.strip().split('/')[-1]) 　　结果 >>> url ' http://images.jupiterimages.com/comm...

python urllib.parse_Python3标准库：urllib.parse分解URL

weixin_39704066的博客

12-04

461

1.urllib.parse分解URLurllib.parse模块提供了一些函数，可以管理URL及其组成部分，这包括将URL分解为组成部分以及由组成部分构成URL。1.1 解析urlparse()函数的返回值是一个ParseResult对象，其相当于一个包含6个元素的tuple。from urllib.parse importurlparseurl= 'http://netloc/path;pa...

Python之urllib.parse模块

weixin_45099622的博客

12-04

287

Python之urllib.parse模块简介：此模块用来处理url的一个模块里面有很多方法，一般用于爬虫中，暂时介绍几种，不定时更新 urlparse(url, scheme=’’, allow_fragments=True)（最常用的方法）作用：可以用来确定网络协议(HTTP、FTP等等 )、服务器地址、文件路径，等。返回值：是一个元组。每个组件是一串字符，也有可能是空的。组件...

python：urllib.parse 用于解析 URL

FuncPlotCalc

03-10

2334

python：urllib.parse 用于解析 URL

python爬虫之urllib.parse详解

热门推荐

haoweixl的博客

03-05

1万+

使用 urlencode() 函数可以将一个 dict 转换成合法的查询参数： dict1 = {'key1': 'one', 'key2': 3, 'key3': '中国', 'key4': '加油' } # 字典类型 import urllib.parse print( urllib.parse.urlencode(dict1) ) 结果为: key1=one&key2=3&am...

urllib.parse 用于解析 URL

C'mon的博客

12-15

1034

该模块定义了一个标准接口，用于将统一资源定位符（URL）字符串拆分为不同部分（协议、网络位置、路径等），或将各个部分组合回 URL 字符串，并将“相对 URL”转换为基于给定的“基准 URL”的绝对 URL。该模块被设计为匹配针对相对统一资源定位符的因特网 RFC。它支持下列 URL 类别:fileftpgopherhdlhttphttpsimapmailtommsnewsnntpprosperorsyncrtsprtspsrtspusftpshttpsipsipssnewssvnsvn+ssh。

Python urllib.request对象案例解析

12-17

- `urllib.parse`模块负责解析和构建URL，可以拆分URL的各个部分（如协议、主机、路径等），便于操作和重组。 - `urllib.robotparser`用于解析网站的`robots.txt`文件，帮助确定哪些页面可以抓取，哪些不能。 4. ...

python3实现url的分隔

qq_35492650的博客

07-16

3447

url简介

python 分解url

weixin_34232744的博客

12-08

251

from urllib.parse import urlsplitprint(urlsplit('https://item.taobao.com/item.htm?id=558080275389&ali_refid=a3_420432_1006:1104687955:N:%E5%A6%88%E5%A6%88%E8%A3%85:be461a591a24869e4f8d8b1c152028e1...

Python(2.7.x)分解URL的简单示例

huey2672的专栏

10-09

1893

import urlparse url = 'http://user:pwd@localhost:8080/tmppath/;parm?key=123#frag' parsed_url = urlparse.urlparse(url) print 'parsed_url:', parsed_url print 'scheme:', parsed_url.scheme print 'netlo

python url解析path_python 将相对url路径解析为其绝对路径

weixin_42562079的博客

02-03

606

def urljoin(base, url, allow_fragments=True):"""Join a base URL and a possibly relative URL to form an absoluteinterpretation of the latter."""if not base:return urlif not url:return basebase, url, _c...

python怎么把字符串分开,如何在python中将网址字符串拆分为单独的部分？

weixin_34270007的博客

01-13

362

I decided that I'll learn python tonight :)I know C pretty well (wrote an OS in it) so I'm not a noob in programming so everything in python seems pretty easy, but I don't know how to solve this probl...

使用python的字符串切割方法切割URL

环游的博客

02-19

2690

已知一个url字符串,对其进行切割 1.以“,”进行切割 >>> a='https://baike.baidu.com/item/%E5%85%83%E5%AE%B5%E8%8A%82/118213?fr=aladdin#1' >>> b=a.split(".") >>> print(b) ['https://baike', 'baidu', ...

python实现切割url得到域名、协议、主机名等各个字段

Together_CZ的博客

11-13

9073

有一个需求就是需要对url进行进一步的划分得到详细的各个字段信息，下面是简单的实现： #!/usr/bin/python # -*- coding: UTF-8 -*- ''' __Author__:沂水寒城功能: 对URL进行分割，基于urlparse, publicsuffix, urllib编写 ''' from urlparse import urlparse import c

python分几部分_将一个完整的url分成几个部分

weixin_29596789的博客

01-29

348

Python3中的urlparse库就是为此而设计的。改编自documentation的示例：>>> from urllib.parse import urlparse>>> o = urlparse('https://api.somedomain.co.uk/api/addresses?postcode=XXSDF&houseNo=34')>&g...

【网络教程】Python如何优雅的分割URL

XiaoqiangClub的博客

09-07

920

Python如何快速的分割URL

# 错误1：直接导入urllib后访问子模块 import urllib urllib.parse.urlencode(...) # AttributeError: module 'urllib' has no attribute 'parse'为什么会造成这个问题