彼岸图链接: https://pic.netbian.com/new/

用到的库:
import requests #请求网页
from lxml import html #解析网页源代码
import time #时间模块
1.单张图片爬取
首先要知道哪个链接才是图片的下载链接(找到下载链接才能使用代码进行存储)
操作步骤:
①随便点进去一张图片
②按f12检查 点击出现的箭头图标 选中图片
可以看到圈住的后缀为jpg格式的链接就是这张图片的下载链接
③复制图片下载链接 以下代码:
import requests
# 构造请求头
headers = {
"user-agent":"Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/96.0.4651.0 Safari/537.36",
"cookie":"__yjs_duid=1_0ed165241c418ef3bd1a08a4f18990101634282593810;Hm_lvt_526caf4e20c21f06a4e9209712d6a20e=1634282597; zkhanecookieclassrecord=%2C65%2C54%2C; yjs_js_security_passport=f2c27672aa84310f33e0f25d8859275320f1e1bd_1634284550_js; Hm_lpvt_526caf4e20c21f06a4e9209712d6a20e=1634284830"
}
url = 'https://pic.netbian.com/uploads/allimg/210528/191150-16222003104792.jpg'
con = requests.get(url,headers=headers).content #请求图片链接并转为二进制(注意图片存储必须以二进制格式)
with open('b.jpg','wb') as f:
f.write(con)
完成效果:
可以看到该脚本下多个以代码中命名的jpg为后缀的