利用Python库urllib.parse可以很方便地帮助我们对URL路径进行解析、拆分。
示例代码如下:
# -*- coding: utf-8 -*-
import urllib.parse as urlparse
path = 'http://example.com/search?q=python+programming&num=10'
url = urlparse.urlparse(path)
运行结果如下:

从上面的运行结果我们可以看出:
成员池数urlparse()会对URL路径字符串“urlparse”进行解析,得到了一ParseResult 对象,这个对象把URL路径进行了分析和拆解。
如果我们把 path 换成是:
'/search?q=python+programming&num=10'
我们可以看一下又是怎么样的效果。
代码如下:
# -*- coding: utf-8 -*-
import urllib.parse as urlparse
path = '/search?q=python+programming&num=10'
url = urlparse.urlparse(path)
运行结果如下:

可见成员函数urlparse()还是挺智能的,它能知道哪些是属于hostname,哪些是属于path,哪些是属于query。
博客介绍了利用Python库urllib.parse对URL路径进行解析、拆分的方法。通过示例代码展示了成员函数urlparse()对URL路径字符串的解析过程,它能将URL路径分析拆解,智能区分hostname、path和query等部分。
1536

被折叠的 条评论
为什么被折叠?



