为什么要url编码
- 为了安全的传输url
- 除了 一下5类字符,其余的都要编码, RFC3986
- 0-9
- a-Z
- 、-_.~4 (4个字符)
- ! * ’ ( ) ; : @ & = + $ , / ? # [ ] (这些是保留字符,路径分隔,参数分隔等作用)
- ~ 波浪线虽然不要求编码,但一些老网关或代理会编码。
- 0 -127 这128个ascii表:
-
- 00~1F + 7F 这32个是控制字符。
- 20~7E 都是可见字符。
怎么编码
- 16进制表示形式,一个字节一个字节的表示 前面用百分号。
- 不要求编码的字符可以不编码,编码了也不影响, 比如a %61
- 中文按字节表示 比如 “中” 三个字节0xE4 0xB8 0xAD, 就是 %E4%B8%AD
utf8编码
- unicode是字符集,是字符集,字符集, utf8才是具体实现, 为什么呢?unicode规则太占空间了。 参考此文
- 第一位是0. 表示单字节字符
- 前面几个1,则表示utf8需要几个字节
- 第一个字节n(表示整体几个字节)个1 + 0 , 后面的字节前两位都是10,其余部分就是unicode编码对应的填充。
unicode编码是大端还是小端
- 一般计算都是小端, 低地址存低位,高地址存高位
- 网络传输,文件存储 是大端, 低地址存高位。这个利于人理解,地址一般是从低到高,例如顺序0x1234。
- unicode文本开头有个字符,FEFF是小端,FFEF是大端。

2760

被折叠的 条评论
为什么被折叠?



