Base64编码原理

Base64是一种基于64个可打印字符来表示二进制数据的表示方法。由于26次方等于64,所以每6个比特为一个单元,对应某个可打印字符。三个字节有24个比特,对应于4Base64单元,即3个字节需要用4个可打印字符来表示。在Base64中的可打印字符包括字母A-Za-z、数字0-9,这样共有62个字符,此外第63和第64两个可打印符号在不同的编码用途中不同。

 

Base64常用于在通常处理文本数据的场合,表示、传输、存储一些二进制数据。包括MIMEemail、在XML中存储复杂数据。

 

编码后的数据比原始数据略长,为原来的4/3。在电子邮件中,根据RFC 822规定,每76个字符,还需要加上一个回车换行。可以估算编码后数据长度大约为原长的135.1%

 

转换的时候,将三个byte的数据,依次放入一个24bit的缓冲区中。数据不足3byte的话,于缓冲器中剩下的bit0补足。然后,每次取出6(因为26=64)个bit,按照其值选择ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789+/中的字符作为编码后的输出。不断进行,直到全部输入数据转换完成。

 

当原数据长度不是3的整数倍时, 如果最后余下一个输入数据,在编码结果后加2个“=”;如果最后余下两个输入数据,编码结果后加1个“=”;如果恰好是3的整数倍,就什么都不要加,这样才可以保证数据还原的正确性。

 

我们举例编码GB23123”这两个字

文本

3

GB2312编码

D5

C5

33

字节码

1

1

0

1

0

1

0

1

1

1

0

0

0

1

0

1

0

0

1

1

0

0

1

1

索引

35

28

20

51

Base64编码

1

c

U

z

                         

 

Base64索引表

A

B

C

D

E

F

G

H

I

J

K

L

M

N

O

P

0

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

Q

R

S

T

U

V

W

X

Y

Z

a

b

c

d

e

f

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

g

h

i

j

k

l

m

n

o

p

q

r

s

t

u

v

32

33

34

35

36

37

38

39

40

41

42

43

44

45

46

47

w

x

y

z

0

1

2

3

4

5

6

7

8

9

+

/

48

49

50

51

52

53

54

55

56

57

58

59

60

61

62

63

 

如果要编码的字节数不能被3整除,最后会多出1个或2个字节,那么可以使用下面的方法进行处理:先使用0字节值在末尾补足,使其能够被3整除,然后再进行base64的编码。在编码后的base64文本后加上一个或两个'='号,代表补足的字节数。也就是说,当最后剩余一个八位字节(一个byte)时,最后一个6位的base64字节块有四位是0值,最后附加上两个等号;如果最后剩余两个八位字节(2byte)时,最后一个6位的base字节块有两位是0值,最后附加一个等号。参考下表:

 

文本

 

GB2312编码

D5

C5

 

字节码

1

1

0

1

0

1

0

1

1

1

0

0

0

1

0

1

0

0

 

 

 

 

 

 

索引

35

28

20

 

Base64编码

1

c

U

=

                         

 

文本

3

 

 

GB2312编码

33

 

 

字节码

0

0

1

1

0

0

1

1

0

0

0

0

 

 

 

 

 

 

 

 

 

 

 

 

索引

12

48

 

 

Base64编码

M

w

=

=

                         

 

Base64编码可用于在HTTP环境下传递较长的标识信息。例如,在Java持久化系统Hibernate中,就采用了Base64来将一个较长的唯一标识符(一般为128-bitUUID)编码为一个字符串,用作HTTP表单和HTTP GET URL中的参数。在其他应用程序中,也常常需要把二进制数据编码为适合放在URL(包括隐藏表单域)中的形式。此时,采用Base64编码不仅比较简短,同时也具有不可读性,即所编码的数据不会被人用肉眼所直接看到。

 

然而,标准的Base64并不适合直接放在URL里传输,因为URL编码器会把标准Base64中的“/”和“+”字符变为形如“%XX”的形式,而这些“%”号在存入数据库时还需要再进行转换,因为ANSI SQL中已将“%”号用作通配符。

 

为解决此问题,可采用一种用于URL的改进Base64编码,它不在末尾填充'='号,并将标准Base64中的“+”和“/”分别改成了“-”和“_”,这样就免去了在URL编解码和数据库存储时所要作的转换,避免了编码信息长度在此过程中的增加,并统一了数据库、表单等处对象标识符的格式。

内容概要:本文系统介绍了算术优化算法(AOA)的基本原理、核心思想及Python实现方法,并通过图像分割的实际案例展示了其应用价值。AOA是一种基于种群的元启发式算法,其核心思想来源于四则运算,利用乘除运算进行全局勘探,加减运算进行局部开发,通过数学优化器加速函数(MOA)和数学优化概率(MOP)动态控制搜索过程,在全局探索与局部开发之间实现平衡。文章详细解析了算法的初始化、勘探与开发阶段的更新策略,并提供了完整的Python代码实现,结合Rastrigin函数进行测试验证。进一步地,以Flask框架搭建前后端分离系统,将AOA应用于图像分割任务,展示了其在实际工程中的可行性与高效性。最后,通过收敛速度、寻优精度等指标评估算法性能,并提出自适应参数调整、模型优化和并行计算等改进策略。; 适合人群:具备一定Python编程基础和优化算法基础知识的高校学生、科研人员及工程技术人员,尤其适合从事人工智能、图像处理、智能优化等领域的从业者;; 使用场景及目标:①理解元启发式算法的设计思想与实现机制;②掌握AOA在函数优化、图像分割等实际问题中的建模与求解方法;③学习如何将优化算法集成到Web系统中实现工程化应用;④为算法性能评估与改进提供实践参考; 阅读建议:建议读者结合代码逐行调试,深入理解算法流程中MOA与MOP的作用机制,尝试在不同测试函数上运行算法以观察性能差异,并可进一步扩展图像分割模块,引入更复杂的预处理或后处理技术以提升分割效果。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值