python为何要伪装而不是直接访问

为什吗python要进行UA伪装?
首先UA是什么ua就是User-Agent这个就是请求载体的身份标识如果我们用浏览器发送请求就意味着当前的url使用浏览器进行打开的请求载体是浏览器而在python中我们发送请求的方式发是requests.get发送请求虽然也能发送请求这个时候url的载体并不是浏览器而是pyhon这个就是浏览器请求方式的唯二两种(如果说的不对评论区纠正毕竟萌新新手上路)一般的门户网站会检测你的请求方式是浏览器还是python所对应的载体身份标识。
如果检测到载体是浏览器的话为正常请求,正常请求就是用户通过浏览器进行的请求服务器端不会拒绝该请求。
另一种情况检测到不是浏览器请求的话维二性所以说请求载体不是某一款浏览器请求不正常推一波就是爬虫服务器端就有可能会拒绝请求。
简单来说UA伪装就是防止被检测出来是爬虫而被拒绝访问
UA伪装到底是什么样呢
在这里插入图片描述这里就是ua正常的请求
在这里插入图片描述

这个是我们python伪装的请求这个请求可以改成顶上的UA
在这里插入图片描述
这个是i请求请求的地址和伪装的UA
总结:UA伪装让爬虫的请求载体身份伪装成某一款浏览及然后避开检测爬取数据

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值