读取xm了,html等如果编码不正确,会报一种非常奇异的异常
前言中不允许有内容
出现这种问题的原因,就是因为html或者xml或者其他要读取的文件的编码问题,是不是utf-8带签名

UTF-8 BOM中的BOM,全称为Byte order mark。
带BOM(签名)的UTF-8文本文件与不带BOM的UTF-8文本文件的区别在于:前者在文件的开头有3个字节 EF BB BF
在windows平台上,默认的utf-8格式文本都是带BOM的,并且文本编辑器都能识别BOM;而在其他的平台,比如Linux下的文本处理器很可能是不识别BOM的,会导致文件的第一行读不出来。而一般上认为不带BOM的utf-8格式是标准格式。

遇到这种问题,可以将编码调整为UTF-8编码,不带BOM即可。
本文探讨了UTF-8编码中BOM(Byteordermark)引发的奇异异常,重点在于Windows与非Windows平台上的差异,提供了解决方法,即如何调整为无BOM的UTF-8编码以避免读取问题。
2138

被折叠的 条评论
为什么被折叠?



