初始python爬虫-爬取彼岸图单张到全部图片

最新推荐文章于 2024-01-19 14:15:44 发布

双手.合十

最新推荐文章于 2024-01-19 14:15:44 发布

阅读量2.8k

点赞数 2

分类专栏： python_爬虫文章标签：爬虫 xpath

本文链接：https://blog.youkuaiyun.com/weixin_50582335/article/details/121455516

版权

初始python爬虫-爬取彼岸图单张到全部图片

1.单张图片爬取
2.一页图片
3.多页图片

彼岸图链接: https://pic.netbian.com/new/
在这里插入图片描述

用到的库:

import  requests  #请求网页
from lxml import html #解析网页源代码
import time #时间模块

1.单张图片爬取

首先要知道哪个链接才是图片的下载链接（找到下载链接才能使用代码进行存储）

操作步骤:
①随便点进去一张图片
②按f12检查点击出现的箭头图标选中图片
在这里插入图片描述
可以看到圈住的后缀为jpg格式的链接就是这张图片的下载链接

在这里插入图片描述
③复制图片下载链接以下代码:

import requests
# 构造请求头
headers = {
   
    "user-agent":"Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/96.0.4651.0 Safari/537.36",
    "cookie":"__yjs_duid=1_0ed165241c418ef3bd1a08a4f18990101634282593810;Hm_lvt_526caf4e20c21f06a4e9209712d6a20e=1634282597; zkhanecookieclassrecord=%2C65%2C54%2C; yjs_js_security_passport=f2c27672aa84310f33e0f25d8859275320f1e1bd_1634284550_js; Hm_lpvt_526caf4e20c21f06a4e9209712d6a20e=1634284830"
}
url = 'https://pic.netbian.com/uploads/allimg/210528/191150-16222003104792.jpg'
con = requests.get(url,headers=headers).content #请求图片链接并转为二进制(注意图片存储必须以二进制格式)
with open('b.jpg','wb') as f:
    f.write(con)