Base64编码和其在图片的传输的应用

最新推荐文章于 2024-09-30 09:40:40 发布

原创

最新推荐文章于 2024-09-30 09:40:40 发布 · 905 阅读

1 ·

CC 4.0 BY-SA版权

Base64是一种在网络上传输二进制数据的编码方式，常用于解决非可打印字符的传输问题，如图片。编码原理是将3个字节数据分为4组，每组6位，并用64个可打印字符表示。位数不足时用'='填充。在图片传输中，Base64编码能保证数据完整性，避免特殊字符导致的传输错误。C++可以实现Base64的编码和解码功能。

Base64

[原文链接]
目前Base64已经成为网络上常见的传输8Bit字节代码的编码方式之一。做支付系统时，系统之间的报文交互都需要使用Base64对明文进行转码，然后再进行签名或加密，之后再进行（或再次Base64）传输。那么，Base64到底起到什么作用呢？
在参数传输的过程中经常遇到的一种情况：使用全英文的没问题，但一旦涉及到中文就会出现乱码情况。与此类似，网络上传输的字符并不全是可打印的字符，比如二进制文件、图片等。Base64的出现就是为了解决此问题，它是基于64个可打印的字符来表示二进制的数据的一种方法。
电子邮件刚问世的时候，只能传输英文，但后来随着用户的增加，中文、日文等文字的用户也有需求，但这些字符并不能被服务器或网关有效处理，因此Base64就登场了。随之，Base64在URL、Cookie、网页传输少量二进制文件中也有相应的使用。

Base64的编码原理

Base64的原理比较简单，每当我们使用Base64时都会先定义一个类似这样的数组：

['A', 'B', 'C', ... 'a', 'b', 'c', ... '0', '1', ... '+', '/']

在这里插入图片描述
上面就是Base64的索引表，字符选用了"A-Z、a-z、0-9、+、/" 64个可打印字符，这是标准的Base64协议规定。在日常使用中我们还会看到=或==号出现在Base64的编码结果中，=在此是作为填充字符出现，后面会讲到。

具体转换步骤

第一步，将待转换的字符串每三个字节分为一组，每个字节占8bit，那么共有24个二进制位。
第二步，将上面的24个二进制位每6个一组，共分为4组。
第三步，在每组前面添加两个0，每组由6个变为8个二进制位，总共32个二进制位，即四个字节。
第四步，根据Base64编码对照表（见下图）获得对应的值。

从上面的步骤我们发现：

Base64字符表中的字符原本用6个bit就可以表示，现在前面添加2个0，变为8个bit，会造成一定的浪费。因此，Base64编码之后的文本，要比原文大约三分之一。
为什么使用3个字节一组呢？因为6和8的最小公倍数为24，三个字节正好24个二进制位，每6个bit位一组，恰好能够分为4组。

示例说明

最低0.47元/天解锁文章