爬虫递归爬取图片-自动翻页（可直接套用）

没人看的垃圾博客

已于 2022-02-16 09:40:12 修改

阅读量2.7k

点赞数 6

分类专栏： python爬虫文章标签： python 爬虫

于 2020-01-09 11:47:46 首次发布

本文链接：https://blog.youkuaiyun.com/jiwei_1234____5/article/details/103901897

版权

前期准备

需要下好一些包：

request
urllib3
PyQuery

安装教程有很多，我就不过多描述了
值得一提的是PyQuery可以使用类似CSS选择器的方式选择标签，大大的提高了选择标签的效率
我使用了递归爬取组图只需要传入组图的第一页地址，和找到下一页地址就可以递归爬取了，直接看代码吧

import requests
import os
import time from requests.packages
import urllib3 from pyquery
import PyQuery as pq
def getNextPageUrl(doc):
    linkList=doc("a")
    nextUrl=""
    for item in linkList.items():
        a=item.text().strip()
        temp=a[0:3]
        # print(temp)