上一篇提到了中文字符的长度,这篇主要就这点做了些测试,代码如下:
执行结果如下:
补充:
查看python中默认编码设置:
由于在文件的头上已经指明了#-*- coding: utf-8 -*- ,则s的编码已是utf-8。
在utf-8下,英文字母占一个字节,中文占3个字节;
unicode下的中文是1个字符(双字节);
GBK编码下的中文占2个字节。(感谢keakon的指正)
本文通过Python代码演示了不同编码方式下中文字符的长度差异。详细对比了UTF-8、Unicode及GBK编码中字符串长度的不同,并解释了每种编码下中文字符所占字节数的原因。
上一篇提到了中文字符的长度,这篇主要就这点做了些测试,代码如下:
执行结果如下:
补充:
查看python中默认编码设置:
由于在文件的头上已经指明了#-*- coding: utf-8 -*- ,则s的编码已是utf-8。
在utf-8下,英文字母占一个字节,中文占3个字节;
unicode下的中文是1个字符(双字节);
GBK编码下的中文占2个字节。(感谢keakon的指正)

被折叠的 条评论
为什么被折叠?