问题描述:
最近在编写代码时,出现了用同一个程序生成的xml文件,用记事本打开,居然文件格式不一样,一个是utf-8的,一个是ansi码。
应用场景:
相同的是:程序使用的是tinyxml, encoding都是设置为utf-8
不同的是:utf-8文件,接受的是utf-8数据响应;ansi码接受的是gbk的数据。
最终结果:
最终导致,接受utf-8数据生成是utf-8文件,接受gdk数据生成的是ansi码文件。
如何判定文件类型?
通过记事本打开文件,我通过这篇博文知道记事本如何判定文件格式的,博客地址:http://blog.youkuaiyun.com/hll127/article/details/6938767
疑惑的地方:
接受gbk数据的文件,最终用记事本打开显示属性是ansi码,而不是gdk文件,显示居然是正常的(因为我在文件中指定encoding="utf-8", 按照上篇博文应该要用utf-8打开才对,但是用utf-8打开,必然有乱码,所以肯定是记事本作了手脚)
解惑:
最终通过强制改变tinyxml的源码,指定使用useMicrosoftBOM, 就是在文件头中加入utf-8的标识,最终记事本通过utf-8打开了(通过另存为时,发现文件格式是utf-8的)
解决办法:
为了统一编码格式,只有把gbk编成utf-8再写入文件了。