你可能不知道的是,有很多字符,使用python2和python3的md5加密出来的结果是不一样的
|
|
zfc cd
|
按代码差异来将,就是在python3中需要对字符串进行 encode 操作,如果没有则会报错:
|
|
|
这是因为加密时需要将字符串转化为 bytes 类型,3默认编码是 utf-8 .所以我用utf-8进行解码.
分析
如果字符串中没有 chr(163) ,那么两个版本结果是一致的,也就是说问题出在这个chr(163)中:
|
|
|
在这里说明通过 chr 得到的结果是一致的, 将它转为 bytes 类型看看:
|
|
|
python3中,在 num<128 的时候,使用 chr(num).encode('utf-8') 得到的是 一个 字符的ascii十六进制,而 num>128 的时候,使用 chr(num).encode('utf-8') 得到的是 两个 字节的ascii十六进制.
解决
改用 latin1 编码进行解码:
|
|
|
额外
为什么是 latin1 编码呢.答案还是挺有意思的.
先说chr函数,通过 help(chr) 可以查看:
|
|
|
意思是它返回Unicode编码中指定位置的一个字符.python3内部也是用Unicode表示左右字符,即str类型.而通过encode后会编码成 bytes 类型.
ascii编码中每个字符编码是一个byte,但只有1-127. 超过的部分128-255则属于 Extended ASCII ,python3 中默认的ascii中不包含这部分,所以如果执行 chr(163).encode("ascii") 就会报错 'ascii' codec can't encode character '\xa3' in position 3: ordinal not in range(128)
因此需要一个含有128-255中的部分字符的编码,且采用1个Byte固定大小编码,比如ISO 8859-1,也就是 latin1.当然还有其他编码如cp1252也包含这些字符的.
探讨了Python2.7与Python3.6中MD5加密处理的差异,特别是在处理特殊字符时的不同表现。揭示了在Python3中使用UTF-8编码与Latin1编码对加密结果的影响。
938

被折叠的 条评论
为什么被折叠?



