1:unicode 编码:
unicode 即统一码 是一种在计算机上使用的字符编码,为每种语言中的每个字符设定唯一的二进制编码。以满足跨语言,跨平台进行文本转换处理的要求。
其中编码方式有三种:UTF-8,UTF-16,UTF-32都是数据转换成程序数据的编码方案。
1: UTF-8最大特点是可变字节,长度有1-4字节。一个字节可以容纳256个字符,如下所示:
Unicode编码(16进制) UTF-8 字节流(二进制)
000000 - 00007F 0xxxxxxx
000080 - 0007FF 110xxxxx 10xxxxxx
000800 - 00FFFF 1110xxxx 10xxxxxx 10xxxxxx
010000 - 10FFFF 11110xxx 10xxxxxx 10xxxxxx 10xxxxxx
对于0x00-0x7F之间的字符,UTF-8编码与ASCII编码完全相同。
2:unicode是一种所有字符都使用两个字节编码的编码模式也称为宽字符。Unicode字符和字符串常量用前缀L来表示
_T宏可以把一个引号引起来的字符串,根据你的环境设置,使得编译器会根据编译目标环境选择合适的(Unicode还是ANSI)字符处理方式 。 如果你定义了UNICODE,那么_T宏会把字符串前面加一个L。这时 _T("ABCD") 相当于 L"ABCD" ,这是宽字符串,此时szieof(_T("ABCD") = 10。 如果没有定义,那么_T宏不会在字符串前面加那个L,_T("ABCD") 就等价于 "ABCD" 。
3:如何设置Unicode编码格式 :工程属性 -> 配置属性 -> 常规 -> 字符集