爬虫请求头之User-Agent本质

文章讲述了如何通过Python爬虫利用User-Agent进行伪装,通过随机选择浏览器标识来模拟不同的请求,从而获取服务器响应。作者展示了如何使用requests库和BeautifulSoup解析响应内容。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

爬虫就是一个伪装者,伪装成浏览器跟服务器沟通,并向服务器请求信息。

那么,爬虫在伪装时,最简单也最常用的方法就是利用User-Agent。

通常,我们是把整个User-Agent的键一起打包传入requests.get()里面。

其实,也可以把User-Agent的键(即各种浏览器)放到一个列表里,然后随机抽取一个浏览器传入到requests.get()里面伪装,然后向服务器发送请求。

import requests
import random
from bs4 import BeautifulSoup
url = 'https://www.mafengwo.cn/?city8.com'
headers_list = ['Mozilla/5.0','Windows NT 10.0' ,'Win64', 'x64', 'AppleWebKit/537.36 (KHTML, like Gecko)',
                'Chrome/116.0.0.0', 
                'Safari/537.36', 'Edg/116.0.1938.81'
                ]
headers_random = random.choice(headers_list)
headers_mfw ={'User-Agent':headers_random}

mfw_res = requests.get(url, headers= headers_mfw)
print(headers_mfw)
print(mfw_res.status_code)

运行上面的代码,也能成功获得服务器的响应:

是不是也挺有趣?

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值