家里领导下了一个任务,把一个网页转成PPT。网页上有几十个图片,转成PPT,每个页面一个图片。说要是做的好,以后还有类似的网页要转。作为新时代的码农,总不能用CTRL+C 和 CTRL+V解决嘛。
先分析网页。图片代码如下:

找到下载链接。
上bs4 和 pptx库,当然少不了 Faker
import requests
from bs4 import BeautifulSoup
from pptx import Presentation
from pptx.util import Inches
import os
from faker import Factory
本段代码只适合爬取1页图片,如那种多页的,需要做判断,循环完成。
# encoding: utf-8
"""
@author: 陈年椰子
@contact: hndm@qq.com
@version: 1.0
@project:test
@file: web2ppt.py
@time: 2021-7-5 11:11
说明
从网页采集图片,生成PPT
"""
import requests
from bs4 import BeautifulSoup
from pptx import Presentation
from pptx.util import Inches
import os
from faker import Factory
# 生成user-agent
fc = Factory.create()
header = {
"User-Agent": fc.user_agent()
}
# 图片缓存目录
img_path = "D:\\temp\\IMG\\"
# PPT文件
ppt_file = "D:\\temp\\ppt1.ppt"

本文介绍如何利用Python的BeautifulSoup和pptx库,自动化地将含有图片的网页转换为PPT文件。任务是将网页上的每个图片分别放在PPT的不同页面上,代码适用于单页图片爬取,多页情况需增加循环判断。
最低0.47元/天 解锁文章
1176

被折叠的 条评论
为什么被折叠?



