Visual Studio 2015的坑:中文字符串编译后成乱码

本文介绍了一个使用Visual Studio 2015编译包含中文字符串的.NET程序时遇到的乱码问题,并给出了问题的原因及解决办法。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

(2015年8月5日更新:微软已经修复了Roslyn的这个bug,详见 https://github.com/dotnet/roslyn/pull/4303

昨天,我们用VS2015编译了博客程序中的一个程序集并发布上线。

今天有园友反馈向我们反馈,个人博客分页显示随笔列表的页面中,“上一页”“下一页”显示乱码:

而这个地方的“上一页”“下一页”字符串恰恰是在我们昨天发布的程序集中定义的:

public class Pager : Control
{
    protected string PreviousText = "上一页";
    protected string NextText = "下一页";

    //...
}

可是昨天我们并没有更改这部分代码,肯定不是我们昨天代码修改引起的。

于是,我们改用VS2013重新编译了一下这个程序集,更新之后,乱码立马消失。

接着,用ILSpy反编译了VS2015所编译出的程序集的IL代码之后,真相大白:

public class Pager : Control
{
    protected string PreviousText = "ÉÏÒ»Ò³";
    protected string NextText = "ÏÂÒ»Ò³";
    //...
}

原来是VS2015所用的编译器惹的祸,而这个编译器就是大名鼎鼎的 Roslyn

大家使用 Visual Studio 2015 时需要注意一下这个问题。

【补充】

用ildasm查看VS2015编译出来的程序集的IL代码(乱码):

.maxstack  2
IL_0000:  ldarg.0
IL_0001:  ldstr      bytearray (C9 00 CF 00 D2 00 BB 00 D2 00 B3 00 ) 
IL_0006:  stfld      string BlogServer.Web.Controls.Pager::PreviousText
IL_000b:  ldarg.0
IL_000c:  ldstr      bytearray (CF 00 C2 00 D2 00 BB 00 D2 00 B3 00 ) 
IL_0011:  stfld      string BlogServer.Web.Controls.Pager::NextText

用ildasm查看VS2013编译出来的程序集的IL代码(未乱码):

.maxstack  2
IL_0000:  ldarg.0
IL_0001:  ldstr      bytearray (0A 4E 00 4E 75 98 )                               // .N.Nu.
IL_0006:  stfld      string BlogServer.Web.Controls.Pager::PreviousText
IL_000b:  ldarg.0
IL_000c:  ldstr      bytearray (0B 4E 00 4E 75 98 )                               // .N.Nu.
IL_0011:  stfld      string BlogServer.Web.Controls.Pager::NextText

【问题原因与临时解决方法】

在GitHub上提交Issue之后,从回复中得知这个问题与Roslyn检测文件编码的处理方式有关。

查看出现乱码问题的.cs文件编码,发现用的是ANSI编码。于是以UTF-8编码另存该文件,然后用VS2015重新编译,问题解决。

VS2015 RC中没这个问题。

【GitHub上的相关链接】

* VS2015打开非unicode编码的代码,其中变量名有中文就无法编译的bug

* .NET compiler produces incorrect string constants in MSIL when C# source files encoded with non-UTF-8 encoding

* VS2015 (MSBuild/14) compiler can't detect file ecoding correctly

* Chinese string is compiled to garbage characters

* Roslyn can't detect 932 encoding

转载于:https://www.cnblogs.com/cmt/p/4692920.html

### 配置宽字符以避免中文输出乱码 为了确保在 Visual Studio 中能够正确显示和处理宽字符(如中文),可以采取多种措施来防止乱码的发生。 #### 修改系统区域设置 对于操作系统级别的配置,建议调整系统的区域设置为支持 Unicode UTF-8 编码。这可以通过进入 Windows 设置中的时间与语言部分,具体路径为:`设置 > 时间和语言 > 语言和地区`,随后选择管理语言选项并勾选“使用 Unicode UTF-8 提供全球语言支持”,最后确认更改并重启计算机[^1]。 #### 调整IDE内部编码方式 针对 Visual Studio 自身而言,除了依赖于操作系统的全局设定外,还可以通过修改 IDE 的环境变量来进行局部优化。创建一个新的系统级环境变量 `PYTHONIOENCODING` 并将其值设为 `UTF8` 可能有助于改善某些情况下遇到的文字渲染问题;不过需要注意的是此方法主要适用于 Python 开发者,并不一定对所有编程场景有效[^3]。 #### 更新注册表键值 如果上述两种方案未能解决问题,则可考虑直接编辑 Windows 注册表。定位到 `HKEY_CURRENT_USER\Console\` 下对应 VS 版本的相关条目,将其中名为 Codepage 的DWORD 类型数据更改为 `936` (即 GBK 字符集)。请注意备份好原始状态以防万一造不必要的影响。 #### 添加预处理器指令 另一种有效的解决方案是在源代码文件顶部加入特定的编译指示语句,比如: ```cpp #pragma execution_character_set("utf-8") ``` 这条命令告知编译器采用指定字符集解释后续文本内容,从而减少因默认编码差异而导致的错误可能性[^4]。 此外,在实际编写 C++ 或其他支持多字节/宽字符的语言时,应当始终优先选用标准库函数而非低层次 I/O 函数进行国际化字符串的操作。例如利用 wstring 和 wcout 来代替 string 和 cout 处理含有非 ASCII 符号的信息流。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值