图像、音频及其他资源处理与网页抓取行为准则
1. 图像、音频及其他资源处理
1.1 使用 screenshotapi.io 进行网页截图
1.1.1 准备工作
首先,访问 www.screenshotapi.io 注册一个免费账户。注册完成后,获取一个 API 密钥,此密钥用于对服务进行身份验证。
1.1.2 操作步骤
示例脚本为 04/09_screenshotapi.py
,运行该脚本即可进行网页截图。代码如下:
from core.website_screenshot_with_screenshotapi import WebsiteScreenshotGenerator
from core.file_blob_writer import FileBlobWriter
from os.path import expanduser
# 获取截图
image_bytes = WebsiteScreenshotGenerator("bd17a1e1-db43-4686-9f9b-b72b67a5535e")\
.capture("http://espn.go.com", 500, 500).image_bytes
# 将截图保存到文件
FileBlobWriter(expanduser("~")).write("website_screenshot.png", image_bytes)
</