一,HTTP是什么?
HTTP的全称是超文本传输协议(HyperText Transfer Protocol),它是互联网上的一种网络协议,设计HTTP最初的目的是为了提供一种发布和接收HTML页面的方法。
HTTP 的作用就是指导浏览器和服务器如何进行沟通。
二,HTTP的请求
1.请求的格式:
1 动词 路径 协议/版本
2 Key1: value1
2 Key2: value2
2 Key3: value3
2 Content-Type: application/x-www-form-urlencoded
2 Host: www.baidu.com
2 User-Agent: curl/7.54.0
3
4 要上传的数据
- 请求最多包含四部分,最少包含三部分。(也就是说第四部分可以为空)
- 第三部分永远都是一个回车(\n)
- 动词有 GET POST PUT PATCH DELETE HEAD OPTIONS 等
- 这里的路径包括「查询参数」,但不包括「锚点」
- 如果你没有写路径,那么路径默认为 /
- 第 2 部分中的 Content-Type 标注了第 4 部分的格式
2.让我们用Chrome开发者工具(F12)查看 HTTP 请求内容
- 打开 Network
- 地址栏输入网址
- 在 Network 点击,查看 request,点击「view source」
- 可以看到请求的前三部分了
- 如果有请求的第四部分,那么在 FormData 或 Payload 里面可以看到
三,HTTP的响应
1.响应格式:
1 协议/版本号 状态码 状态解释
2 Key1: value1
2 Key2: value2
2 Content-Length: 17931
2 Content-Type: text/html
3
4 要下载的内容
2.状态码:
- 状态码要背,是服务器对浏览器说的话
- 1xx 请求已被服务器接收,继续处理
- 2xx 请求已成功被服务器接收、理解、并接受
- 3xx 表需要后续操作才能完成这一请求
- 4xx 请求含有词法错误或者无法被执行
- 5xx 服务器在处理某个正确请求时发生错误
- 注:具体状态的解释可以参考这个网站,例如状态码404表示:
请求失败,请求所希望得到的资源未被在服务器上发现,但允许用户的后续请求。没有信息能够告诉用户这个状况到底是暂时的还是永久的。假如服务器知道情况的话,应当使用410状态码来告知旧资源因为某些内部的配置机制问题,已经永久的不可用,而且没有任何可以跳转的地址。404这个状态码被广泛应用于当服务器不想揭示到底为何请求被拒绝或者没有其他适合的响应可用的情况下。
https://zh.wikipedia.org/wiki/HTTP状态码zh.wikipedia.org
- 第 2 部分中的 Content-Type 标注了第 4 部分的格式
- 第 2 部分中的 Content-Type 遵循 MIME 规范
3.让我们用Chrome开发者工具(F12)查看 HTTP 响应内容
- 打开 Network
- 输入网址
- 选中第一个响应
- 查看 Response Headers,点击「view source」,点击「view source」,点击「view source」
- 你会看到响应的前两部分
- 查看 Response 或者 Preview,你会看到响应的第 4 部分
四,使用 curl 命令来发送请求并得到响应
示例:
curl -s -v -H -- "https://www.baidu.com"
运行后的代码如下
请求的内容
> GET / HTTP/1.1
> Host: www.baidu.com
> User-Agent: curl/7.60.0
> Accept: */*
响应的内容
< HTTP/1.1 200 OK
< Accept-Ranges: bytes
< Cache-Control: private, no-cache, no-store, proxy-revalidate, no-transform
< Connection: Keep-Alive
< Content-Length: 2443
< Content-Type: text/html
< Date: Sat, 09 Jun 2018 13:39:04 GMT
< Etag: "588603ec-98b"
< Last-Modified: Mon, 23 Jan 2017 13:23:56 GMT
< Pragma: no-cache
< Server: bfe/1.0.8.18
< Set-Cookie: BDORZ=27315; max-age=86400; domain=.baidu.com; path=/
<