UTF-8 可变长字符编码,是unicode码的具体实现,UTF-8用1到6个字节编码Unicode字符。如果只有一个字节则其最高二进制位为0;如果是多字节,其第一个字节从最高位开始,连续的二进制位值为1的个数决定了其编码的字节数,其余各字节均以10开头。
GBK 专门为解决汉字的编码而生成的解决方案。字符有一字节和双字节编码,00–7F范围内是第一个字节,和ASCII保持一致,此范围内严格上说有96个文字和32个控制符号。之后的双字节中,前一字节是双字节的第一位。总体上说第一字节的范围是81–FE(也就是不含80和FF),第二字节的一部分领域在40–7E,其他领域在80–FE
UTF-8与GBK的编码规则
最新推荐文章于 2024-10-16 08:00:00 发布