GET和POST
GET:查询参数都会在URL上显示出来
POST:查询参数和需要提交数据是隐藏在form表单里面的,不会在URL地址上显示出来
例子:
我们用百度搜索“python”,查看源代码(怎么查看元代码可以看此博客https://blog.youkuaiyun.com/qr39hh/article/details/106179234)
这里使用的是GET方法,URL上有显示出参数。
使用有道翻译翻译“博客”,参数没有显示在URL中。
User-Agent 用户代理
作用:记录用户的浏览器、操作系统等,为了让用户更好的获取HTML页面效果
User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.129 Safari/537.36
Refer
表明当前这个请求是从哪个URL过来的。一般情况下可以用来做反爬的技术
状态码
- 200:请求成功
- 301:永久重定向
- 302:临时重定向
- 403:服务器拒绝请求
- 404:请求失败(服务器无法根据客户端的请求找到资源(网页))
- 500:服务器内部请求
抓包工具
- Elements:元素,网页源代码(提取数据和数据分析)
- Console:控制台(打印信息)
- Sources:信息来源(整个网站加载文件)
- NetWork:网络工具(信息抓包)能够看到很多的网页请求