python3 下载 并 保存 pdf

本文介绍了一种使用Python的requests库来下载其官方PDF文档的方法。通过简单的代码示例,展示了如何发送GET请求并保存响应内容到本地文件。
部署运行你感兴趣的模型镜像
import requests

# python requests 的pdf 文档
requests_pdf_url = "https://buildmedia.readthedocs.org/media/pdf/requests/master/requests.pdf"
r = requests.get(requests_pdf_url)
filename = "requests.pdf"
with open(filename, 'wb+') as f:
    f.write(r.content)

 

您可能感兴趣的与本文相关的镜像

Python3.8

Python3.8

Conda
Python

Python 是一种高级、解释型、通用的编程语言,以其简洁易读的语法而闻名,适用于广泛的应用,包括Web开发、数据分析、人工智能和自动化脚本

要实现Python全页面截屏保存PDF,可以使用Python的selenium库和pyPdf库来实现。 首先,需要安装selenium库和pyPdf库。可以使用pip来进行安装: ``` pip install selenium pyPdf ``` 接下来,我们需要下载安装Chromedriver。Chromedriver是用于控制Chrome浏览器的一个工具。可以通过以下链接下载Chromedriver: https://sites.google.com/a/chromium.org/chromedriver/downloads 下载完成后,将下载的Chromedriver解压,将其路径添加到系统环境变量中。 接下来是编写代码。以下是一个示例代码: ```python from selenium import webdriver from pyPdf import PdfWriter import time # 创建Chrome浏览器驱动 driver = webdriver.Chrome() # 打开网页 driver.get('https://www.example.com') # 等待页面完全加载 time.sleep(5) # 获取页面高度 height = driver.execute_script("return document.documentElement.scrollHeight") # 创建一个空的PDF文件 output_pdf = PdfWriter() # 设置截图的宽度和高度 driver.set_window_size(1920, height) # 循环滚动页面截屏 for i in range(0, height, 1080): # 滚动页面 driver.execute_script(f"window.scrollTo(0, {i})") time.sleep(1) # 截屏保存为临时文件 driver.save_screenshot('/tmp/temp.png') # 将截屏图片添加到PDF文件中 output_pdf.add_page('/tmp/temp.png') # 保存PDF文件 output_pdf.write('screenshot.pdf') # 关闭浏览器 driver.quit() ``` 代码中,我们首先创建了一个Chrome浏览器驱动。然后打开指定的网页,等待页面完全加载。接着获取页面的高度,创建一个空的PDF文件。然后设置截图的宽度和高度,循环滚动页面,在每一次滚动时进行截屏,将截屏图片添加到PDF文件中。最后保存PDF文件关闭浏览器。 请确保在实际运行代码之前,将以下行代码中的网页链接和文件保存路径修改为你所需的地址: ```python driver.get('https://www.example.com') driver.save_screenshot('/tmp/temp.png') output_pdf.write('screenshot.pdf') ``` 希望对你有所帮助!
评论 8
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值