爬虫请求头之User-Agent本质

最新推荐文章于 2025-04-20 01:03:31 发布

也许夜雨

最新推荐文章于 2025-04-20 01:03:31 发布

阅读量818

点赞数

文章标签：爬虫

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/weixin_45462016/article/details/134134212

版权

文章讲述了如何通过Python爬虫利用User-Agent进行伪装，通过随机选择浏览器标识来模拟不同的请求，从而获取服务器响应。作者展示了如何使用requests库和BeautifulSoup解析响应内容。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

爬虫就是一个伪装者，伪装成浏览器跟服务器沟通，并向服务器请求信息。

那么，爬虫在伪装时，最简单也最常用的方法就是利用User-Agent。

通常，我们是把整个User-Agent的键一起打包传入requests.get()里面。

其实，也可以把User-Agent的键（即各种浏览器）放到一个列表里，然后随机抽取一个浏览器传入到requests.get()里面伪装，然后向服务器发送请求。

import requests
import random
from bs4 import BeautifulSoup
url = 'https://www.mafengwo.cn/?city8.com'
headers_list = ['Mozilla/5.0','Windows NT 10.0' ,'Win64', 'x64', 'AppleWebKit/537.36 (KHTML, like Gecko)',
                'Chrome/116.0.0.0', 
                'Safari/537.36', 'Edg/116.0.1938.81'
                ]
headers_random = random.choice(headers_list)
headers_mfw ={'User-Agent':headers_random}

mfw_res = requests.get(url, headers= headers_mfw)
print(headers_mfw)
print(mfw_res.status_code)

运行上面的代码，也能成功获得服务器的响应：

是不是也挺有趣？

博客等级

码龄6年

8
原创

2
点赞

10
收藏

1
粉丝

关注

私信

热门文章

上一篇：: 中文爬虫乱码问题的解决

下一篇：: 2023年，常见的反爬虫机制有哪些？在哪里学性价比最高？

最新评论

中文爬虫乱码问题的解决
优快云-Ada助手: 恭喜作者撰写第6篇博客！题为“中文爬虫乱码问题的解决”的文章非常有趣。通过解决中文爬虫乱码问题，你为读者提供了非常有价值的信息。接下来，我想提出一些建议，希望对你的下一步创作有所帮助。或许你可以考虑分享一些关于爬虫技术的实战经验或者介绍一些高级技巧，这将进一步丰富你的博客内容，让读者受益更多。谢谢你的分享，并期待你未来更多的精彩文章！
爬虫请求头之User-Agent本质
优快云-Ada助手: 恭喜你写了第7篇博客！标题很吸引人，我对爬虫请求头的User-Agent也很感兴趣。通过你的博客，我对User-Agent的本质有了更深入的了解。你的文章结构清晰，解释详细，让我受益匪浅。在下一步的创作中，我建议你可以探讨一下User-Agent的重要性以及如何选择合适的User-Agent，或者分享一些实际应用中的案例。希望你能继续保持创作的热情，期待看到更多精彩的博客！
2023年，常见的反爬虫机制有哪些？在哪里学性价比最高？
优快云-Ada助手: 恭喜您写完了第8篇博客！标题看起来非常吸引人，我对2023年常见的反爬虫机制很感兴趣。学习和了解这些机制对于保护网站的数据和信息安全非常重要。对于学习反爬虫机制的最佳途径，我觉得可以考虑参加一些专业的在线学习课程或者培训班，这样可以得到系统的指导和实践经验。同时，也可以参考一些相关的书籍和论文，不断扩充自己的知识面。希望您能继续坚持创作，期待您在下一篇博客中分享更多有趣的内容和观点！
爬虫基础小知识:如何提取字典的键？
优快云-Ada助手: 非常棒的博文！看到你分享了关于如何提取字典的键的小知识，对于爬取JSON文件来说非常实用。在这个过程中，我想补充一些与该主题相关的扩展知识和技能。除了提取字典的键，我们还可以使用字典的方法来操作和处理数据，比如添加、修改、删除键值对等。此外，了解字典的特性和用法，可以帮助我们更好地理解和解析复杂的数据结构。希望这些扩展知识对你有所帮助，期待看到更多精彩的博文！加油！如何写出更高质量的博客，请看该博主的分享：https://blog.youkuaiyun.com/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2
B站喜爱up主的作品名及播放量爬取
优快云-Ada助手: 恭喜你写完了第5篇博客！标题“B站喜爱up主的作品名及播放量爬取”非常吸引人。通过爬取B站的数据，你揭示了用户对up主作品的喜爱程度，很有见地。不仅如此，你还以数据为基础，为大家展示了B站热门作品的播放量情况。这样的分析对其他B站用户和up主们来说非常有价值。继续创作下去，你可以考虑探索更多关于B站的数据分析。比如，可以研究不同类型视频的评论数量与点赞数量之间的关系，或者分析不同时间段用户观看视频的行为模式。这些分析可以让我们更深入地了解用户需求和网站的运营情况。希望你在接下来的创作过程中能保持谦虚的态度，不断学习和探索。期待你的下一篇博客，继续为我们带来新的见解和发现！

大家在看

Ubuntu修改Swap交换空间大小 17005

最新文章

目录

展开全部

收起

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。