Python3 从 URL 中提取域名、路径、参数等数据

最新推荐文章于 2025-06-08 10:14:53 发布

原创最新推荐文章于 2025-06-08 10:14:53 发布 · 7.9k 阅读

·

3

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#Python #URL #提取 #爬虫

Python 专栏收录该内容

167 篇文章

订阅专栏

本文介绍使用Python3的urllib模块解析URL的方法，包括提取URL中的域名、路径等关键信息。

Python3 可谓是做爬虫的利器，既然是利器就能想你所想，比如我们如何从 URL 中提取域名、路径、参数等数据呢？

正则

正则是可以！不过在程序界一直流传着一个说法。有一个程序我们用正则写吧，那么你就有两个问题了。。。

除了正则，Python 标准模块 urllib 也提供类型解决方案（Python2 中的是urlparse 这个包，在 Python3 中都整合到 urllib 中了）

In [1]: from urllib.parse import urlparse                                                                         

In [2]: url = 'https://blog.youkuaiyun.com/yilovexing/article/details/96432467'                                         

In [3]: urlparse(url)                                                                                             
Out[3]: ParseResult(scheme='https', netloc='blog.youkuaiyun.com', path='/yilovexing/article/details/96432467', params='', query='', fragment='')

In [4]: urlparse(url).netloc                                                                                      
Out[4]: 'blog.youkuaiyun.com'

In [5]: urlparse(url).scheme                                                                                      
Out[5]: 'https'

In [6]: urlparse(url).path                                                                                        
Out[6]: '/yilovexing/article/details/96432467'

博客等级

码龄13年

博客专家认证

490
原创

2174
点赞

6070
收藏

6434
粉丝

关注

私信

热门文章

分类专栏

展开全部收起

上一篇：: Supervisor 进程管理工具的安装及使用

下一篇：: Linux 在 Shell 中启动程序出现 [Errno 5] Input/output error 错误解决方案

最新评论

小米路由器4A千兆版 CH341A 编程器刷机教程
不知归期的迷途羔羊: 博主您好是这样的我严格按照您的教程去执行但是固件更新完了之后一直进不去路由器登录界面我换了好几个固件都进不去不知道是什么情况
开发为什么不用 anaconda
G.奉一: importerror: dll load failed while importing _ssl: %1 不是有效的 win32 应用程序。碰到了这个问题，查到的一部分解决方法好像是和anaconda有关才行
Python3 导入上级目录中的模块
落止于g: 我这里测试不行
小米路由器4A千兆版 OpenWRTInvasion 刷机教程
TimeIsTheChoice: 记录一下，https://post.smzdm.com/p/a83dmm8l/ CPU MT7621A，2.5G芯片MT7603EN，5G芯片MT7612EN ，通过ssh刷入breed-mt7621-pbr-m1.bin文件，系统显示rebooting，然后电脑接路由器WAN口亮蓝灯，电脑接路由器LAN口只亮电源灯（微弱白光），无法使用小米修复工具进行修复，长按reset不闪灯，目前准备参考 https://blog.youkuaiyun.com/yilovexing/article/details/129693761 编程器救砖 /(ㄒoㄒ)/~~
小米路由器4A千兆版更换5G芯片和硬件布局后出现的刷机问题
TimeIsTheChoice: 。。。我检查了自己的机器是符合你图中的老板子，ssh刷入breed以后就连不上，然后小米修复工具断开电源，按住reset按键，重新插上电影，4a千兆版的路由器网络灯一直不亮，更别说变橙色闪烁了。。。还有其他方式救砖么

大家在看

最新文章

目录

展开全部

收起

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。