简单的十几行代码下载某库ppt格式的内容
拒绝转载,拒绝商用,拒绝非法爬取
仅供压力巨大的中年人给孩子们找找学习资料
准备工作:
1,打开某库搜索到需要的内容,请选择PPT格式

2, 进入内容页面F12检查源代码可以看到有每个图片的链接,也是每页的链接

3, 可以用xpath或者re获取所需要的链接,或者直接copy在txt中, 我选择笨方法保存到本地的txt中
4, 然后就可以获取每个链接的图片了(成功后如下)

完整的代码如下:
```python
import re, time, os, requests
session = requests.session()
url_list = []
file = open('New Text Document.txt') #获取txt中的每个图片url
for i in file.readlines():
url = i.strip().split(',')
url_list.append(url)
file.close()
path = r'C:\Users\python test\...' #保存图片位置的路径
def get_pic(url_li
Python爬取PPT内容教程

本文介绍如何使用Python简单爬取某库中PPT格式的学习资料,通过查看页面源代码获取每个图片链接,进而下载内容。适用于为孩子寻找学习资料的家长。
最低0.47元/天 解锁文章
4349

被折叠的 条评论
为什么被折叠?



