python爬虫学习笔记01-“抓包”——通过浏览器了解请求方式、请求头、响应头

本文详细介绍了HTTP协议中的GET和POST请求方式,通过Chrome浏览器的开发者工具演示了如何分析请求过程,包括请求方式、状态码、请求头和响应头的查看方法,以及如何直接构造URL进行搜索。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

在http协议中,浏览器发出一个请求,服务器才会给出一个相应,所以在做爬虫时,需要模拟浏览器发出请求,之后才能从服务器的相应中获取数据,请求的方式有很多种,最常用的有两种,get和post,get是从服务器获取数据,post是向服务器提交数据,如用户名密码等。
下面具体的查看一下如何通过浏览器分析请求
1、在chrome浏览器界面中右击——检查
2、在弹出窗口中,按下面步骤点击,可以看到浏览器的请求方式,其中2的位置有很多请求,这些请求应该就是我们后面需要提取的内容(当前的猜测)查看请求方式
3、请求方式下方的status-code表示请求是否成功,服务器是否返回正确的结果,200表示正常
4、下方的两个内容分别代表的就是请求头和相应头了,其中请求头很重要,请求头中的很多参数在编写爬虫时都会用到,例如User-Agent
在这里插入图片描述
5、多个和headers同级别的标签可以帮助我们更全面的查看这个请求的内容、预览、响应等等
6、随便搜索一个内容,之后再查看下地址栏里面的地址,可以观察到地址变成了“https://www.baidu.com/s?wd=搜索内容&键值对&键值对”的形式,也就是说,如果我们直接按照上述范式进行搜索的话,也能够直接得到对应的页面

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值