使用python,利用requests re模块下载文件
import requests
import re
#获取url
url = "https://www.openvswitch.org/support/dist-docs/"
#获取数据
data = requests.get(url).text
#提取数据,(?P<url>.*?)将匹配的(.*?)的值付给变量url
result = re.findall(r'<a href="(?P<url>.*?).pdf">',data)
print(result)
for i in result:
#拼接下载的链接
new_url = url + i + ".pdf"
filename = i + ".pdf"
#print(new_url)
#访问连接
result = requests.get(new_url)
#下载文件,并保存
with open(filename,mode="wb") as f:
f.write(result.content)
Python利用requests和re模块下载文件教程
本文介绍如何使用Python的requests和re模块高效地下载文件,通过结合这两个库,可以实现对文件链接的匹配与文件的下载操作。
881

被折叠的 条评论
为什么被折叠?



