1、源码字符集和执行字符集
源码字符集(the source character set):源码文件时使用何种编码格式保存的。
执行字符集(the execution character):可执行程序内保存的是何种编码(程序执行时内存中字符串编码)
对于GCC编译器来说,可以使用如下命令参数设定。如果没有设定,默认都是UTF-8。
-finput-charset=charset //设置源码字符集为charset
-fexec-charset=charset //设置执行字符集为charset
-fwide-exec-charset=charset //设置宽字符串的执行字符集为charset
对于MSVC来说,其字符集按如下选择:
源码字符集:有BOM,则按BOM解释;没有BOM,则使用本地Locale字符集(随系统设置变化)。
执行字符集:使用本地Locale字符集(随系统设置变化)
对于GCC来说,将执行字符集设置成utf-8只需要将源码保存成utf-8即可(带或不带BOM均可)。
对于MSVC来说(2010以上的版本),要将执行字符集设置成utf-8需要:源码保存成带BOM的utf8,utf16,...,然后添加
#pragma execution_character_set("utf-8")
要想跨GCC4.6+和MSVC2010sp1+,我们需要取它们的交集:也就是
- 源码保存成带BOM的utf8
-
为MSVC添加#pragma
如
#if _MSC_VER >= 1600
#pragma execution_character_set("utf-8")
#endif
int main()
{
char mystr[] = "老老实实的学问,来不得半点马虎";
return sizeof mystr;
}
当MSVC支持C++11的String Literals之时,就可以直接通过以下方式设置
char mystr[] = u8"测试中文";
对于出现乱码,可以从这个3个环节分析:
参考:
以上内容主要摘自:https://blog.youkuaiyun.com/dbzhang800/article/details/7540905
下面两篇文章可以作为补充:
https://www.cnblogs.com/findumars/p/5624858.html
https://www.jianshu.com/p/ed269df8104d
2、QT中的编码说明
对于Qt Creator的源码字符集可以在:工具--选项--文本编辑器--行为 中进行设置。
Qt5中,执行字符集被设置为UTF-8,对于QString来说,其默认编码为utf-8(参考QtCore模块维护者Thiago Macieira 的文章 :https://blog.qt.io/cn/2012/05/16/source-code-must-be-utf-8-and-qstring-wants-it/),也就是说QString执行字符集为utf-8。因此,在Qt显示中文的时候,我们只需要保证执行字符集为utf-8就能正确显示。对执行字符集编码方式设置方法可以参考:https://blog.youkuaiyun.com/iamplane/article/details/78218913
在Qt中执行以下代码:
QString s1 = "汉语";//输出乱码,因为这里没有设置执行字符集,因此会根据系统本地编码方式设置执行字符
//集,我测试是在windows下使用的MSVC,因此执行字符会被设置为GBK。然而,QT需要
//的执行字符集为utf8,因此会乱码。
QString s2 = u8"中文";//将执行支付及设置成了utf8,因此不会乱码。
QTextCodec *code1 = QTextCodec::codecForName("system");//获取系统本地编码方式
QString s3 = code1->toUnicode("英语");//把“英语”的执行字符集从将本地编码方式转换成了unicode,所
//以不会乱码。
qDebug() << s1 << s2 << s3 ;
输出结果如下:
这部分主要参考:https://blog.youkuaiyun.com/dbzhang800/article/details/7542672