ansi和unicode为字符编码的不同标准,ansi采用单字节表示一个字符,但无法满足中文、日文等其他字符,后来出现了unicode编码标准。
ansi的实现方式:
一字节的大小小于128时,其字符的值即对应ascii码的值。
一字节的大小大于128时,该字节和下一下字节满足gb2312编码(或BIG5、JIS)的编码规则。
unicode的实现方式:
两个字节表示一个字符,所以最多可表示65536个字符,目前用了3万多个。
UTF-8,UTF-16等均为unicode编码的实现方式。
本文介绍了ANSI和Unicode两种字符编码的区别。ANSI使用单字节编码,适合英文字符,对于中文等多字节字符支持不足。Unicode采用双字节编码,能够表示更多的字符,包括各种语言文字。此外还介绍了Unicode的实现方式,如UTF-8和UTF-16。
ansi和unicode为字符编码的不同标准,ansi采用单字节表示一个字符,但无法满足中文、日文等其他字符,后来出现了unicode编码标准。
ansi的实现方式:
一字节的大小小于128时,其字符的值即对应ascii码的值。
一字节的大小大于128时,该字节和下一下字节满足gb2312编码(或BIG5、JIS)的编码规则。
unicode的实现方式:
两个字节表示一个字符,所以最多可表示65536个字符,目前用了3万多个。
UTF-8,UTF-16等均为unicode编码的实现方式。
674

被折叠的 条评论
为什么被折叠?