PYTHON写爬虫时用到的相对路径-urljoin

最新推荐文章于 2025-03-09 20:04:57 发布

原创最新推荐文章于 2025-03-09 20:04:57 发布 · 1.2w 阅读

7 ·

CC 4.0 BY-SA版权

文章标签：

#python

本文介绍了如何使用Python的urljoin函数来将相对路径转换为绝对路径。通过几个实例展示了不同类型的相对路径如何被正确地解析并附加到基准URL上。

使用URLJOIN从相对路径获取绝对路径：

>>> from urlparse import urljoin
>>> urljoin("http://www.asite.com/folder/currentpage.html", "anotherpage.html")
'http://www.asite.com/folder/anotherpage.html'
>>> urljoin("http://www.asite.com/folder/currentpage.html", "folder2/anotherpage.html")
'http://www.asite.com/folder/folder2/anotherpage.html'
>>> urljoin("http://www.asite.com/folder/currentpage.html", "/folder3/anotherpage.html")
'http://www.asite.com/folder3/anotherpage.html'
>>> urljoin("http://www.asite.com/folder/currentpage.html", "../finalpage.html")
'http://www.asite.com/finalpage.html'