python-selenium抓图片

最新推荐文章于 2024-05-31 21:24:28 发布

原创最新推荐文章于 2024-05-31 21:24:28 发布 · 466 阅读

1 ·

CC 4.0 BY-SA版权

python 专栏收录该内容

5 篇文章

订阅专栏

本文介绍了一个使用Selenium和Requests库的Python脚本，该脚本能够自动化地从腾讯动漫平台爬取《名侦探柯南》漫画的具体章节内容，包括章节标题和图片资源，并将图片保存到本地文件夹中。脚本通过模拟浏览器操作，如滚动页面和键盘按键，以及执行JavaScript代码来获取所需数据。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

from selenium import webdriver
from time import sleep
import win32api, os
import win32con, requests


def get_conan():
    num = 1
    # 循环120次
    for k in range(1, 121):
        driver = webdriver.Chrome("chromedriver.exe")
        driver.get("https://ac.qq.com/ComicView/index/id/623654/cid/%s" % k)
        driver.maximize_window()
        sleep(2)
        # 一直按下键
        for i in range(1000):
            win32api.keybd_event(40, 0, 0, 0)
            win32api.keybd_event(40, 0, win32con.KEYEVENTF_KEYUP, 0) 
            sleep(0.1)

        # 取出title在处理一下
        js1 = """return document.title"""
        title = driver.execute_script(js1)
        title1 = "第%s集" % num + title.split(" ")[1].split("-")[0]
        os.makedirs(title1)
        js = """
                var arr= [];for(var i=0;i<document.getElementsByClassName("loaded").length;i++){
               arr.push(document.getElementsByClassName("loaded")[i].src)};  return arr;
           """
        res_img = driver.execute_script(js)
        for index in range(len(res_img)):
            res = requests.get(res_img[index], timeout=50)
            with open(r"%s\%s.jpg" % (title1, index), "wb") as f:
                f.write(res.content)
        driver.quit()
        num += 1

        
get_conan()