ANSI和UNICODE：程序设置为MULTI-BYTE或Unicode的区别

最新推荐文章于 2021-10-23 17:57:31 发布

原创最新推荐文章于 2021-10-23 17:57:31 发布 · 1.3k 阅读

7 ·

CC 4.0 BY-SA版权

文章标签：

#VS #编码 #ANSI #Unicode

VisualStudio 专栏收录该内容

5 篇文章

订阅专栏

本文详细介绍了Windows系统中使用的两种字符集：ANSI和Unicode的区别与联系。解释了这两种字符集如何影响编程，并提供了如何在Visual Studio环境中进行设置的指导。

Windows使用两种字符集：ANSI和UNICODE。其中Unicode以16/32位表示一个字符，而ANSI以8位表示一个字符。

ANSI字符标准使用的是8位表示一个字符，所以ANSI用于表示字母和数字以及常用字符是没有问题的。但是无法表示汉字。

Unicode字符标准使用16/32位表示一个字符，所以Unicode可以用于表示汉字。

也就是说，Unicode比ANSI更宽，表示范围更大。

基于中国考虑，尽可能使用Unicode。

VS环境下可以设置字符为MULTI-BYTE或Unicode，默认为Unicode。

Multi-byte使用了ANSI字符集。Unicode使用了Unicode字符集。

因此，根据设置的不同，同一个函数会有两个版本，一个ANSI版，一个Unicode版。ANSI版叫A版，Unicode版更宽，所以叫W版。

NT内核里都是Unicode字串，基本上A版最终调用了W版，少数除外，特别是wininet里都是W的最后转成A的。也就是说，对于Windows编程而言，应尽可能使用Unicode。

有时候会遇到一些char与LPXXSTR之间的转换error。这是因为程序默认是使用Unicode。程序使用Unicode，其程序中的LPXXSTR就都会以Unicode来解释，Unicode是16/32位，所以LPXXSTR就是指向16/32位的数据。char是8位的，将char赋值给LPXXSTR，其位数不同，就会导致error。

如果将程序的字符集改为MULTI-BYTE，则可以解决该问题。但是不建议使用MULTI-BYTE。通常的一个解决方案是使用_T()。_T()是一个适配宏，若程序设置为MULTI-BYTE，则_T()不起作用；若程序设置为Unicode，则_T()会将内部的字符串从ANSI转换为Unicode。所以，Unicode程序最好使用_T()宏来转换。

再比如，在Unicode下MessageBox被编译为MessageBoxW，在MULTI-BYTE下被编译为MessageBoxA。

LPSTR LPCSTRLPWSTRLPCWSTR区别

LPSTR 一个32位的指向字符串的指针
LPCSTR 一个32位的指向字符串常量的指针
LPWSTR 一个32位的指向Unicode字符串的指针
LPCWSTR 一个32位的指向Unicode字符串常量的指针
前面的字母含义：

L代表LONG

P就是指针的意思,

C就是constant的意思
W是wide的意思，

STR就是string的意思

LPSTR = char *
LPCSTR = constchar *
LPWSTR =wchar_t *
LPCWSTR = constwchar_t *
LPOLESTR = OLECHAR* =BSTR = LPWSTR (Win32)
LPCOLESTR = const OLECHAR* =LPCWSTR (Win32)
LPTSTR =_TCHAR *
LPCTSTR = const_TCHAR *
即wchar指的是Unicode。