理解 HTTP 中的 multipart/form-data

本文介绍了HTTP协议中的multipart/form-data,用于在一次请求中发送多种类型的数据。multipart允许数据分多个部分,每个部分有自己的Content-Type和元数据。在Web表单提交,尤其是文件上传时,这种格式广泛应用。客户端需正确设置请求头,服务器则依据boundary解析数据。
部署运行你感兴趣的模型镜像

HTTP 是一种基于请求-响应模型的网络通信协议,主要用于 Web 中客户端和服务器之间通信的数据传输。事实上,如今的互联网就是构建在 HTTP 之上的。基于请求-响应模式的通信方式很简单,客户端向服务器发送请求,服务器处理请求并进行响应。
HTTP 其实并不关心我们想要传输的是什么类型的数据,因为它什么类型的数据都可以传输!对于客户端或者服务器来说,只需要设置好合适的 Content-Type,让另一端能够理解数据就可以了。在一个请求中,客户端发送给服务器的数据可以是文本,也可以是图片或者音视频等等。
如果客户端想在一个请求中给服务器发送多种类型的数据呢,该怎么办呢?例如,同时发送用户的基本信息和头像。方法很简单,就是使用 HTTP 的 multipart。

Multipart 消息结构

Multipart 允许客户端在一次 HTTP 请求中发送多个部分(part)数据,每部分数据之间的类型可以不同。Multipart 并不是一种专一的数据类型,它有很多子类型,例如:multipart/mixedmultipart/form-data 等。
通俗来讲,一个 multipart 消息就是一个大包裹,包裹里面有多个不同类型的消息,每一个消息就是一个 part,每个 part 都会声明自己的消息类型(Content-Type)。除了消息类型,part 还可以附加一些元数据。
Multipart 消息的基本语法结构可以在 RFC2046 中找到:

  • 每个 multipart 消息的 Content-Type 都必须包含一个叫做 boundary 的参数,boundary 声明了各个 part 之间的边界,记为 ${boundary}。实际上,完整的边界定义为:一行由两个 - 加上 ${boundary} 组成的字符串。假设我们在 Content-Type 里面指定的 boundary=example-part-boundary,那么按照协议规定,每个 part 之间的分隔行就是:--example-part-boundary
  • 每个边界之后是一个 CRLF 加下一个 part 的头部信息。如果下一个 part 没有头部信息,边界之后就应该跟两个 CRLF,这样下一个 part 的消息类型就会被认为是 text/plain
  • ${boundary} 不能出现在边界之间,并且长度不能超过 70 个字符。
  • 最后一个 part 之后的边界在末尾多了两个 -,表示后面不会再有其它的 part 了。这个边界的完整格式为:--${boundary}--,例如 --example-part-boundary--

我们会在后面讲 multipart/form-data 给出一个具体的示例。

multipart/form-data

Multipart 的使用在 Web 应用程序中很常见。使用 multipart 频率最高的地方大概就是 Web 表单了,在表单提交时,文件的上传就是通过 Multipart 来实现的。
并不是所有的表单提交都会使用 multipart,如果表单只包含基于文本的输入组件(例如输入框、单选框等),浏览器会将这些数据以 key=value 的形式组织,使用一种被称为 application/x-www-form-urlencoded 的 Content-Type 传输。
如果表单中包含文件或图片等不能被编码成文本的元素,浏览器就会使用 multipart/form-data 向服务器传输数据。

下面是一个使用 multipart/form-data 传输用户信息的例子:

POST /profile HTTP/1.1
HOST: example.com
Content-Type: multipart/form-data; boundary=example-part-boundary

--example-part-boundary
Content-Disposition: form-data; name="username"
Content-Type: text/plain

Nicholas
--example-part-boundary
Content-Disposition: form-data; name="address"
Content-Type: application/json

{
    "country": "China",
    "city": "Beijing"
}
--example-part-boundary
Content-Disposition: form-data; name="avatar"; filename="my_avatar.jpeg"
Content-Type: image/jpeg

<binary-image data>
--example-part-boundary--

在上面这个请求中:

  • Content-Type: multipart/form-data; boundary=example-part-boundary 表示这个请求的的消息类型是 multipart-form-data,每个 part 之间的边界为 example-part-boundary
  • 这个请求总共包含三个 part:
    • 第一个 part 的类型为 text/plain,它在表单上对应的 key 为 usernamevalue 为 Nicholas
    • 第二个 part 的类型为 application/json,它在表单上对应的 key 为 address
    • 第三个 part 的数据类型为 image/jpeg,它在表单上对应的 key 为 avatar,并且 part 的头部还附加了文件名相关的元数据 filename="my_avatar.jpeg
  • 最后面的 --example-part-boundary-- 表示整个 multipart 消息的结束。

总结

Multipart 是一种常见的数据格式,常用于上传文件和发送包含多种数据类型的单个请求。正确地使用 multipart 可以方便地实现多种数据的传输,提高数据传输效率和用户的使用体验,减少服务器的请求次数。
但是,在使用 multipart 的时候,客户端必须正确地设置 Content-Type 请求头,包含 boundary 参数,并且 boundary 参数的内容不能和请求体内的内容重复。服务器收到请求后,需要根据 Content-Type 设置的 boundary 来解析请求体各个部分的内容。

您可能感兴趣的与本文相关的镜像

Python3.10

Python3.10

Conda
Python

Python 是一种高级、解释型、通用的编程语言,以其简洁易读的语法而闻名,适用于广泛的应用,包括Web开发、数据分析、人工智能和自动化脚本

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值