python爬虫之图片

细精本精

已于 2024-12-06 02:53:04 修改

阅读量735

点赞数 2

分类专栏： python爬虫文章标签： python 爬虫

于 2024-12-06 01:33:44 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/qq_48224700/article/details/144279468

版权

python爬虫专栏收录该内容

21 篇文章

订阅专栏

一起进步吧！感谢大家的支持和关注

需求

如何爬取多媒体资源（图片，音频，视频，动图）
爬取一张图片，保存到本地

分析

找一张百度上的图片的地址

问题

多媒体资源都是二进制，返回数据时用content
持续化存储要用wb模式

源代码

import requests

headers = {
    'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/97.0.4692.71 Safari/537.36X-Requested-With: XMLHttpRequest'
}
# 获取图片地址：通常为img标签的src属性值
img_src = "https://img0.baidu.com/it/u=3074825518,2446056497&fm=253&fmt=auto&app=120&f=JPEG?w=500&h=500"
# 对图片发起请求
response = requests.get(url=img_src, headers=headers)
# 获取图片数据:content返回的是二进制形式的响应数据
img_data = response.content
# 持久化存储
with open('./xx.jpeg', 'wb') as fp:
    fp.write(img_data)

不足

爬取一张根本没有什么用
爬虫的关键就在于怎样去批量爬取

博客等级

码龄5年

68
原创

514
点赞

392
收藏

298
粉丝

关注

私信

热门文章

分类专栏

嵌入式 1篇
前端 1篇
vue3 和 jquery 3篇
网络安全 10篇
云计算运维 2篇
go 3篇
数据结构 1篇
算法 1篇
python爬虫 21篇
C 和C++ 1篇
python 16篇
数据库 1篇
LINUX 7篇
自动化测试
ERROR

展开全部收起

最新评论

python之FastAPI框架
阿J~: 晚上睡不着，打开了佬的博客，瞬间就精神了
python爬虫之cookie
顾铭.324: 参数md5__1038不是动态的吗，不需要逆向吗？
python之网络编程必会篇
码到π退休: 优秀，学习了，大佬此文带给我在该领域更深的思考，感谢大佬对技术的无私奉献，期待您出更精彩的下回分解！

大家在看

百度外链建设技术策略研究

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。