【Java EE】-使用Fiddler抓包以及HTTP的报文格式_java 结合fiddler抓包-优快云博客

本文链接：https://blog.youkuaiyun.com/m0_63979882/article/details/130393336

作者：学Java的冬瓜
博客主页：☀冬瓜的主页🌙
专栏：【JavaEE】
分享: 在满园弥漫的沉静的光芒之前，一个人更容易看到时间，并看到自己的身影。——史铁生《我与地坛》

主要内容：使用FIddler抓包的方法，使用FIddler抓包需要知道的注意事项。HTTP协议报文格式:首行，header，空白行，body。HTTP协议中可以自定义的属性。HTTP中get和post请求的区别。HTTP中的header的部分属性分析。HTTP响应状态码

在这里插入图片描述

HTTP协议是应用层最广泛使用的协议之一，HTTP协议为浏览器BS(客户端CS)和服务器的交互制定了规范。

一、使用Fiddler抓包

理解:

HTTP协议的详细交互过程，可以借助第三方工具来看到，我们这里使用Fiddler，抓取HTTP的交互。（wireshark可以抓包传输层TCP/UDP，网络层IP，数据链路层mac等）

理解1：Fiddler本质上是一个代理程序，在客户端(浏览器)发出请求时，请求会先经过代理服务器，然后再到目标服务器，再返回响应给代理服务器，由代理服务器将响应返回给客户端。在请求和响应经过代理服务器时，代理服务器将请求和响应记录下来，再提供可视化界面。
理解2：代理服务器可以分为正向代理(客户端的代理)，反向代理(服务器的代理)。上述例子就是正向代理，反向代理比如CDN服务器，企业将一些资源放在运营商的CDN服务器上，便于降低自己服务器压力，且提高客户访问效率。

使用Fiddler抓包注意事项：
1> Fiddler可能会与其它代理程序冲突，使用时要关闭其它代理程序，包括一些浏览器插件。
2> 需要开启HTTPS功能
3> 可能需要手动下载证书，并让导入到浏览器中

第二个注意事项：下载安装后是这样的：然后点：tools->options->https，然后把可以勾选的全部勾上。就开启了HTTPS功能。

第三个注意事项：如果浏览器中不导入证书，那么打开Fiddler访问网站时，可能无法访问(我就遇到了)！所以可能需要手动添加证书到浏览器。
具体操作：1> 选择信任该证书tools->options->https->actions->Trust Root
->Certificate->yes。2> 然后把证书放在桌面 actions->Export Root Certificate to Desktop 3> 在谷歌浏览器导入Fiddler证书：点击谷歌浏览器右上角三个点->设置->隐私和安全->安全->滑到下面点击管理HTTPS/SSL证书->导入->下一页->浏览(把刚才保存在桌面的证书导入浏览器)->导入 4> Fiddler和浏览器都重新启动！

使用Fiddler:

1> 要抓包时，可以先点上面的工具栏 X->Remove all，清空原来抓到的包

2> 发送http请求，抓到包后找到我发送的包，双击就可以查看了。

在右边的请求响应中，可以使用多种方式显示查看内容。

3> 发送完http请求后，返回Fiddler，选择file->Capture Traffic(或者F12)，就可以暂时停止抓包，便于观察。

二、HTTP协议报文格式

1、Fiddler抓到的get和post方法的包

get请求：
在这里插入图片描述

post请求和响应：
在这里插入图片描述

从上面的图示中我们可以发现，http的请求报文格式可以分成4个部分：首行、请求头(header)、空白行、请求体(body)。
如果是get请求，则请求报文格式中没有body，因为get请求传输的信息放在了首行中；而post请求有body，传输信息放在body中。为什么这么说呢？请往下看。

2、HTTP报文格式中的详细信息

在这里插入图片描述

2.1、`首行:`

1> 请求行：请求报文中的首行

get方法:
在这里插入图片描述

post方法：
在这里插入图片描述

其实get和post没有本质上的区别，但是携带数据的方式不同。在上图中我们可以看到，get请求的传输数据放在地址栏上，以键=值&键=值的方式传输；而post在地址栏上没有数据传输，传输数据放在body中发送。
从上图我们可以知道，一个请求的首行可以分为 http方法 URL 协议版本。
下面我们来谈谈URL。一个get请求的URL可以分为协议名称 域名/ip 端口 路径 ?查询字符串，其中查询字符串以键=值&键=值的方式组织
URL中的一些内容，是可以省略的！端口不写时，是服务器随机分配一个端口给客户端；路径可以是斜杠，比如http://www.baidu.com/，/代表http服务器的根目录；一个post请求则没有查询字符串，因为post一般不用于查询，而是提交数据。

2> 响应行：响应报文中的首行。
响应行中get和post请求一样，都是 协议版本 状态码 状态描述，并且响应的状态描述可以省略，因为状态码其实已经描述了这次请求是否成功。

2.2、`header:`

header：包括请求头，响应头。这里我们主要说请求头，header中描述了http发送时的各种属性。我们主要我们来了解几个比较常用的，请往下看：

1> 请求头：请求部分的header

Fiddler抓到的qq登录的post的请求包的header：
在这里插入图片描述

Host：描述了这次请求的服务器所在的ip和端口，这个内容大概率是和URL中的内容一样，但也有一定概率不同，比如如果使用正向代理服务器，那么地址栏上的ip和端口是代理服务器的，但是Host这里的ip和端口则是你最终要访问的服务器的，而非代理服务器的ip和端口。
Content-Length：描述了这次请求 body 中的数据长度
Content-Type：描述了这次请求 body 中的数据格式
User-Agent：描述了客户端的浏览器版本和操作系统的版本，用来区分是 pc端还是移动端。
Referer：描述了当前页面的来源URL，如果直接通过地址栏输入地址，或者直接点击收藏夹，都是没有Referer的。我们用这个Referer的属性，来描述一个应用场景：广告主需要浏览者从其他网站跳到自己的网站，从而达到打广告的目的。给其它网站(广告平台)发广告点击费时，需要按照网站的来源给相应的广告平台发钱，所以referer记录了其他网站(就是自己网站的来源)，根据记录的这些其它网站就可以对应到相应的广告平台(浏览器)点击数量，从而正确的发钱。但http有一个问题，就是运营商劫持，运营商的路由器/交换机(可以完成五层转发的)等可以把 referer改变，运营商从中赚钱，但是改变了真实的情况。HTTPS就可以解决这样的问题。
Cookie：浏览器给网页提供的本地存储数据的机制(缓存机制)，通过键值对的方式组织。
1> Cookie从哪来？Cookie从服务器来，当浏览器向服务器发起第一次请求时，服务器根据 http响应中的报头(Set-Cookie)字段，决定Cookie要存什么
2> Cookie存在那里？第一次请求时，服务器将Cookie返回给浏览器，浏览器把它存在浏览器缓存中(和硬盘一样)，通过浏览器 + 域名的方式组织大量的 Cookie，不同浏览器的Cookie不同，同一个浏览器的不同域名Cookie也不同。Cookie中内容不仅有键值对，还有过期时间。
3> Cookie往哪去？往服务器去。同一个用户可以开多个窗口，客户端同一时刻很多，那怎么知道哪个客户端上次访问的数据的是什么状态，就是使用Cookie。当浏览器第二次发送相同的域名请求时，会把和第二次请求相同的第一次请求对应的Cookie带上，服务器就可以知道这个请求对应的客户端的状态是怎么样的了。

2> 响应头：响应部分header

响应部分的属性和请求的header大部分一样，但是数据格式不一样：ContentType不同(和响应中body的数据格式对应)。
在这里插入图片描述

2.3、`空白行:`

空白行：get和post请求的空白行功能相同，都是作为header结束的标志

2.4、`body:`

包括请求体，响应体。
get请求没有请求体，post请求有请求体。

get/post 响应的body 可以是html，css，js，图片…

1> post请求的请求体(body)：

注意：正文(请求体)中的内容格式和响应报文中的分析的 header 中的 Content-Type 密切相关.

application/x-www-form-urlencoded: form 表单提交的数据格式，此时请求体body 的格式如下:

title=test&content=hello

multipart/form-data: form 表单提交的数据格式(在 form 标签中加上
enctyped=“multipart/form-data” . 通常用于提交图片/文件，请求体body格式如下：

Content-Type:multipart/form-data; boundary=----WebKitFormBoundaryrGKCBY7qhFd3TrwA 
------WebKitFormBoundaryrGKCBY7qhFd3TrwA 
Content-Disposition: form-data; name="text" 
title 
------WebKitFormBoundaryrGKCBY7qhFd3TrwA 
Content-Disposition: form-data; name="file"; filename="chrome.png" 
Content-Type: image/png 
PNG ... content of chrome.png ... 
------WebKitFormBoundaryrGKCBY7qhFd3TrwA--

application/json 数据为 json 格式，请求体body如下：

{"username":"123456789","password":"xxxx","code":"jw7l","uuid":"d110a05ccde64b16
a861fa2bddfdcd15"}

2> get/post 的响应体(body)

在响应头中的Content-Type描述了响应体(body)的数据格式。

text/html 类型的数据
text/css 类型数据
application/javascript 类型数据
application/json 类型数据

例如：application/json类型的响应体如下：

{"msg":"操作成功","code":200,"token":"eyJhbGciOiJIUzUxMiJ9.eyJsb2dpbl91c2VyX2tleSI6IjIxYmU0YTczLTk0ODQtNGIwYi05Mjk1LWJmNTdiMzE2YWVmNSJ9.BrmJEZBh959TxJNi5A8tuG-cVaIBs2i51RKY6dlLjGKfwe3V9rRXt_FRRsdwrQd1pgc0b5jGalYvQLc_Rr60cg"}

3、http协议中可以自定义的属性

1> URL中的路径
2> URL中的 query string
3> header中的键值对
4> header中的Cookie键值对
5> body

三、HTTP请求方法

1、get和post请求的区别(重点)

类型：

get请求的类型：
1> 在浏览器地址栏输入url，回车
2> 在html中的标签 link script img a等
3> 使用ajax get请求，通过ajax异步获取数据，通常返回json数据格式
post请求的类型：
1> 登录
2> 上传文件

get和post的区别：
get和post，没有本质上的区别，只是在使用习惯上有以下几个区别：

传输数据： GET传输数据通过地址栏上的 query string(查询字符串)；post则通过请求体(body)
用法： GET一般用于从服务器获取数据；POST一般用于给服务器提交数据
幂等： GET请求通常被设置成幂等的；而POST不要求幂等。幂等就是多次输入相同请求，结果一样。
缓存：由于GET被设置成幂等，GET可以被缓存；而POST不能被缓存。

另外1>以前的get请求存在传输上限，而如今rft标标准文档中没有明确的规定。2>不好说post比get更安全，安全应当是由https破除浏览器和服务器的中间人(黑客)来实现了安全(看下面的https加密流程)，而get请求是显示信息在地址栏上，不好说不安全，因为我可以使用加密算法改变后，即使敏感信息出现在地址栏上，别人也看不懂。

2、其它方法

在http方法中，get方法是最常用的，其次是post，其它方法不常用，比如下面几个方法。
DELETE 删除服务器指定资源
OPTIONS 返回服务器所支持的请求方法
HEAD 类似于GET，只不过响应体不返回，只返回响应头
TRACE 回显服务器端收到的请求，测试的时候会用到这个
CONNECT 预留，暂无使用

四、HTTP响应状态码

响应行(状态行，首行)中存在状态行，描述状态。

总的来说状态码可以这样分：
1** hold on（稍候）
2** here you are（成功）
3** go away（重定向）
4** you fucked up（客户端错误）
5** I fucked up（服务器端错误）

需要特殊记住的几个状态码：
200 ok 成功
302 重定向
404 not Found 访问资源不存在
403 forbidden 访问被拒绝(没有权限访问)
405 方法不被允许 (Method not allowed) 表示对应的 http 请求方法没有实现
500 服务器内部错误(代码抛出异常)
504 gateway timeout (浏览器等候服务器响应超时)