通用正则, 抓取a标签href属性

最新推荐文章于 2024-03-10 18:47:09 发布

atopx

最新推荐文章于 2024-03-10 18:47:09 发布

阅读量7.2k

点赞数 3

CC 4.0 BY-SA版权

分类专栏： Python 文章标签：正则表达式

本文链接：https://blog.youkuaiyun.com/qq_43125439/article/details/85098837

Python 专栏收录该内容

26 篇文章

订阅专栏

本文介绍了一种使用Python的正则表达式模块re来从HTML字符串中提取URL的方法。通过一个具体的示例，展示了如何定义一个正则表达式来匹配和捕获URL，并给出了运行结果。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

import re
# url通用匹配
url_regex = re.compile('<a[^>]+href=["\'](.*?)["\']', re.IGNORECASE)
# test
url_str = "<a type='akfdf' href='http://www.itmeng.top' xxxx>hahah</a>"
result = url_regex.findall(url_str)
print(result)

# ---------运行结果------------
>>> print(result)
['http://www.itmeng.top']