当你在查看一些python源码或者其他人的代码的时候,经常会在.py的文件里看到 from future import unicode_literals
在Python中有些库的接口要求参数必须是str类型字符串,有些接口要求参数必须是unicode类型字符串。
对于str类型的字符串,调用len()和遍历时,其实都是以字节为单位的,这个太坑爹了,同一个字符使用不同的编码格式,长度往往是不同的。
对unicode类型的字符串调用len()和遍历才是以字符为单位,这是我们所要的。
另外,Django,Django REST framework的接口都是返回unicode类型的字符串。
为了统一,我个人建议使用from future import unicode_literals,将模块中显式出现的所有字符串转为unicode类型,不过,对于必须使用str字符串的地方要加以注意。
关于字符串类型,也是Python2坑爹的地方。
本文讨论了Python中字符串类型的差异,并提出了使用fromfuture import unicode_literals来统一字符串类型为unicode的建议,以便于处理不同编码格式下的一致性问题。
966

被折叠的 条评论
为什么被折叠?



