selenium 屏幕快照

这篇博客展示了如何利用selenium自动化工具结合PhantomJS浏览器驱动,抓取网页并保存为屏幕快照。代码中,首先设置了浏览器驱动,然后访问了一个特定的网页地址,等待页面加载,滚动到页面底部,最后保存了页面的截图。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

# -*- coding:utf-8 -*-
from selenium import webdriver
from bs4 import BeautifulSoup
import pdfcrowd
import re
import time
if __name__ == '__main__':

    # options = webdriver.ChromeOptions()
    # options.add_argument('user-agent="Mozilla/5.0 (Linux; Android 4.0.4; Galaxy Nexus Build/IMM76B) AppleWebKit/535.19 (KHTML, like Gecko) Chrome/18.0.1025.133 Mobile Safari/535.19"')
    # driver = webdriver.Chrome(chrome_options=options)

    # driver = webdriver.Firefox()
    driver = webdriver.PhantomJS('E:\\phantomjs-2.1.1-windows\\bin\\phantomjs.exe')
    # driver.set_page_load_timeout(20)
    driver.get('http://view45.book118.com/pdf/dXAyNS5ib29rMTE4LmNvbS44MFwzNzAxNjgtNTkyODhkYjZlY2YzZi5kb2N4?readpage=g2xLH%404OWN2hJtxm49ja3Q%3D%3D&furl=YOQStEpojXDkR5q1h7jAA6aP2h6TJ9QI%409WXyuBb6wi1A9xo624sBXDTyLmGc8KG6I6E4wyI8nSzs61yjeSGy0WXsg70I77KTh9GrnOK3R0%3D&token=3%40bcmzZZiuExhHvwl8Ucz8c%40U5kSkPSg')
    driver.maximize_window()
    # html = driver.page_source
    # bf1 = BeautifulSoup(html, 'html5lib')
    time.sleep(1)
    # 将页面滚动条拖到底部
    pdf = driver.find_element_by_id('pdf')
    driver.execute_script("arguments[0].style.display = 'block';", pdf)
    time.sleep(10)
    # print 'pdf===',pdf
    js = "var q=arguments[0].scrollTop=1000"
    driver.execute_script(js, pdf)
    time.sleep(10)
    driver.save_screenshot('E://4.png')
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值