Visual C++ 字符编码设置

本文介绍了VC中的两种主要编码方式:文件编码和内存编码,并详细探讨了内存编码中的三个选项:NotSet、UseMulti-ByteCharacterSet及UseUnicodeCharacterSet。此外,还对比了多字节字符集(MBCS)和Unicode的特点。

1. VC的编码我们大致可以分为两类:文件编码和内存编码。

文件编码(用UntraEdit可以看到里面的编码)即源代码文件的编码,gbk,UTF-8等。

内存编码即源代码编译成为二进制文件的时候采用的编码。


2. 在此我要说的是内存编码;内存编码在VC中只有3个选项:

(1)Not Set

(2)Use Multi-Byte Character Set

(3)Use Unicode Character Set


3. Multi-Byte Character Set(MBCS

    多字节字符集,字符的大小是可变的;一个MBCS编码包含一些一个字节长的字符,而另一些字符大于一个字节的长度。   

    一个MBCS编码包含一些一个字节长的字符,而另一些字符大于一个字节的长度。用在Windows里的MBCS包含两种字符类型,单字节字符(single-byte   characters)和双字节字符(double-byte   characters)。由于Windows里使用的多字节字符绝大部分是两个字节长,所以MBCS常被用DBCS(double-byte   character   set   or   DBCS)代替。

    在DBCS编码模式中,一些特定的值被保留用来表明他们是双字节字符的一部分。例如,在Shift-JIS编码中(一个常用的日文编码模式),0x81-0x9f之间和   0xe0-oxfc之间的值表示"这是一个双字节字符,下一个子节是这个字符的一部分。"这样的值被称作"leading bytes",他们都大于0x7f。跟随在一个leading   byte子节后面的字节被称作"trail  byte"。在DBCS中,trail  byte可以是任意非0值。像SBCS一样,DBCS字符串的结束标志也是一个单字节表示的0。 

4. Unicode

Unicode是一种所有的字符都使用两个字节编码的编码模式。Unicode字符有时也被称作宽字符(Wide Character),因为它比单子节字符宽(使用了更多的存储空间)。注意,Unicode不能被看作MBCS。MBCS的独特之处在于它的字符使用不同长度的字节编码。Unicode字符串使用两个字节表示的0作为它的结束标志


5. 参考

(1)http://blog.youkuaiyun.com/jackiezhw/article/details/3901685

(2)http://blog.youkuaiyun.com/jackiezhw/article/details/3901685

### 如何在 Visual C++设置编码以避免字符乱码问题 为了避免字符乱码问题,在开发过程中可以采取多种方法来确保程序能够正确处理不同类型的字符集。以下是具体的解决方案: #### 设置源文件的编码格式 Visual Studio 默认可能不会将源代码文件保存为 UTF-8 编码,这可能导致中文或其他非 ASCII 字符显示异常。可以通过以下方式更源文件的编码格式[^1]: 1. 打开项目中的某个 `.cpp` 或 `.h` 文件。 2. 转到菜单栏 `文件 -> 高级保存选项...`。 3. 将编码为 `UTF-8 without signature (-)`。 通过此操作,可确保所有新创建或编辑过的文件都采用统一的编码标准,从而减少因编码不一致而导致的乱码现象。 #### 修项目的字符集配置 对于 Windows 平台上的应用程序来说,默认情况下可能会使用 ANSI 字符集而非 Unicode。如果目标平台支持多语言环境,则建议切换至 Unicode 模式以便更好地兼容各种文字系统[^2]: 1. 右键点击解决方案资源管理器里的工程名称并选择属性对话框; 2. 定位到 Configuration Properties->General 下找到 Character Set 属性项; 3. 把其值设成 Use Unicode Character Set 即完成转换过程。 另外需要注意的是当涉及到字符串常量定义时也要相应调整语法形式比如由原先仅含英文状态下的双引号包裹成为 L"" 形式的宽字串表示法或者 u8"" 的 UTF-8 版本声明等方式之一取决于具体需求场景而定[^3]. ```cpp // 使用宽字符版本函数替代窄字符版本 #include <iostream> int main() { std::wcout << L"你好,世界!" << std::endl; // 输出Unicode字符串 } ``` 以上措施结合起来可以帮助开发者有效预防由于编码差异所引发的一系列问题如上述提到的汉字无法正常呈现等情况发生.
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值