python 网页截取

本文介绍了如何使用Python的Selenium库自动化加载网页内容,并通过执行JavaScript脚本来实现页面滚动,以便捕获完整页面内容的截图。通过设置窗口大小、加载页面、执行滚动操作和保存截图等步骤,实现对网页复杂内容的完整捕获。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

# -*- coding: utf-8 -*-
#
# author: oldj <oldj.wu@gmail.com>
#
 
from selenium import webdriver
import time
 
 
def capture(url, save_fn="capture.png"):
  browser = webdriver.Firefox() # Get local session of firefox
  browser.set_window_size(1200, 900)
  browser.get(url) # Load page
  browser.execute_script("""
    (function () {
      var y = 0;
      var step = 100;
      window.scroll(0, 0);
 
      function f() {
        if (y < document.body.scrollHeight) {
          y += step;
          window.scroll(0, y);
          setTimeout(f, 50);
        } else {
          window.scroll(0, 0);
          document.title += "scroll-done";
        }
      }
 
      setTimeout(f, 1000);
    })();
  """)
 
  for i in xrange(30):
    if "scroll-done" in browser.title:
      break
    time.sleep(1)
 
  browser.save_screenshot(save_fn)
  browser.close()
 
 
if __name__ == "__main__":
 
  capture("http://www.jb51.net")

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值