猿人学 — 第1届第17题
-
根据题目“天杀的Http2.0”大概知道,请求的协议应该遵照的是Http2.0协议,并且目标网站专门对此进行了检测,在Network面板中右键表头,勾选Protocol

-
果不其然,一堆请求都是遵照Http2.0协议。而
urllib和request只支持HTTP/1.1协议访问,因此面对强制使用HTTP/2.0协议访问的网站无法爬取数据,所以这里选择支持HTTP/2.0协议访问的httpx -
继续抓包分析可知,
http://match.yuanrenxue.cn/match/17请求的响应体中返回了Set-Cookie,设置了sessionid。可知必须先请求对其请求获取sessionid后再进行后续请求
-
源码如下
import httpx # httpx和req

最低0.47元/天 解锁文章
329

被折叠的 条评论
为什么被折叠?



