python 下载PDF学习笔记

原创

已于 2023-03-13 15:18:26 修改 · 1.1k 阅读

3 ·

CC 4.0 BY-SA版权

文章标签：

#pdf #python

于 2023-03-13 14:45:28 首次发布

python下载PDF

前置步骤同普通下载txt等文件一致，在数据抓取后需要转为二进制字节流形式保存，写入也要用二进制写入到新的pdf文件。

示例1 利用io转二进制

import io
import requests
def download_pdf(save_path,pdf_name,pdf_url):
    send_headers = {
        "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/61.0.3163.100 Safari/537.36",
        "Connection": "keep-alive",
        "Accept": "text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8",
        "Accept-Language": "zh-CN,zh;q=0.8"}
    response = requests.get(pdf_url, headers=send_headers)
    bytes_io = io.BytesIO(response.content)#转二进制
    with open(save_path + "%s.PDF" % pdf_name, mode='wb') as f:
        f.write(bytes_io.getvalue())#写入
        print('%s.PDF,下载成功！' % (pdf_name))